Seis pesquisadores do Instituto de Ciência e Tecnologia (ICT/Unifesp), da Escola Paulista de Medicina (EPM/Unifesp) e do Instituto Tecnológico da Aeronáutica (ITA) uniram técnicas do Aprendizado de Máquina (Machine Learning) e do geoprocessamento em saúde para estruturar um modelo capaz de identificar os fatores de risco que levam pacientes infectados com o Coronavírus a quadros graves e à internação. A inovação, desenvolvida por Ana Carolina Lorena, Carlos Kiffer, Horácio Hideki Yanesse, Leila Abuabara, Luiz Leduíno de Salles e Maria Gabriela Valeriano, pode fornecer insights ainda mais precisos para gestores da área da saúde daqui para frente.
De maneira simplificada, um modelo preditivo trata-se de uma fórmula matemática que concentra uma grande quantidade de dados que, cruzados, indicam padrões e tendências futuras sobre os mais diferentes problemas, como a disseminação de doenças. Para esse modelo específico, os pesquisadores se basearam no diagnóstico de mais de 255 mil pacientes atendidos em unidades de saúde do município de São José dos Campos entre março de 2020 e maio de 2021.
Os dados foram consolidados pelo Instituto de Pesquisa e Planejamento (IPPLAN) a partir de informações fornecidas pelos pacientes ao realizarem testes de covid-19 em farmácias, laboratórios ou hospitais da região. Alguns dos atributos de maior peso no levantamento foram idade, sexo, sintomas e comorbidades. Foram mantidos no estudo, porém, apenas 17% dos testes registrados, 19.484 (44,7%) homens e 24.095 (55,3%) mulheres.
Tal diminuição ocorreu devido à chamada “limpeza dos dados”, uma etapa que inclui ajustes, transformações, e filtros das informações coletadas. Com isso, foram excluídos formulários com erros no preenchimento, ausência de informação, resultado de exame pendente e inconsistências. “Também eliminamos testes não representativos, ou seja, casos em que a pessoa preencheu menos de três campos entre sintomas e comorbidades, pois não geraria informação útil para nós”, explica Abuabara.
O estudo apontou que os sintomas mais frequentemente relatados entre os pacientes testados para covid-19 foram tosse (77,9%), febre (58,9%) e dor de garganta (53,5%), seguidos de dispneia (38,7%), baixa saturação de oxigênio (10,6%) e dificuldade respiratória (9,2%). Quanto às comorbidades, as mais mencionadas foram doença cardiovascular crônica (18,2%), diabetes mellitus (12,1%), doenças respiratórias crônicas, como a asma (5,7%), além da imunodepressão (1,5%).
O desenvolvimento da doença também foi observado atentamente. No período avaliado, 79% dos indivíduos não precisaram ser hospitalizados e 91% não se tratavam de casos graves. Entre os que precisaram de um leito de UTI, 37,6% permaneceram internados por até 5 dias, 28,7% de 6 a 10 dias e 33,7% ficaram hospitalizados por mais de 11 dias. Dos que vieram a falecer, 58% eram do sexo masculino e 42%, do feminino.
De acordo com os pesquisadores, a ideia é aperfeiçoar esses modelos preditivos. “Planejamos testar nossos modelos na prática em parceria com a secretaria municipal de saúde, além de avaliar a inclusão de mais atributos aos modelos, principalmente para investigar como se comportam frente aos casos de novas variantes da doença, como a delta”, finalizam.