TCC de aluno da Unifesp apresentou método automatizado para classificação de pneumonia e Covid-19 via app

Um trabalho de conclusão de curso (TCC) da graduação em Engenharia de Computação do Instituto de Ciência e Tecnologia (ICT) da Universidade Federal de São Paulo (Unifesp), campus São José dos Campos (SP), de autoria do aluno Matheus Augusto de Castro Santos, teve como objetivo desenvolver um método automatizado para classificação de pneumonia e Covid-19 em imagens de raios X via aprendizagem profunda.

A pesquisa contou com a orientação da professora Lilian Berton e foi iniciada em 2021 durante uma iniciação científica do Programa Institucional de Bolsas de Iniciação Cientifica (PIBIC) da Unifesp. O estudante do ICT testou algumas bases de dados de imagens torácicas de pacientes saudáveis, acometidos por pneumonia e por Covid-19. Ele desenvolveu um aplicativo para Android® para classificar as imagens. O trabalho foi indicado pela Unifesp para concorrer ao Prêmio Anual do CNPq em 2022.

Durante a iniciação científica, Santos encontrou dificuldades para identificar bases de dados confiáveis, reconhecer as imagens via câmera de celular entre outras questões. Por conta disso, no TCC, defendido em janeiro de 2022, optou por desenvolver um sistema web para reconhecimento de imagens, utilizando um conjunto de imagens maior e obtendo maior confiabilidade.

O reconhecimento das imagens de raios X é feito via aprendizagem profunda, uma das técnicas de aprendizado de máquina, uma subárea da Inteligência Artificial (IA) que visa desenvolver algoritmos que possam aprender a reconhecer padrões em grandes bases de dados. “A aprendizagem profunda utiliza redes neurais artificiais compostas por várias camadas. As redes neurais são algoritmos inspirados no funcionamento do cérebro humano, compostos por nós conectados imitando os neurônios do cérebro. Esses algoritmos usam dados de treinamento para aprender a reconhecer padrões e podem ser usados em novos dados não vistos no processo de treinamento”, explica a professora Lilian.

Para o TCC foram analisados conjuntos de imagens radiográficas da região torácica de pacientes com pneumonia, com Covid-19 e pacientes saudáveis. As imagens foram obtidas a partir de um levantamento em bases de dados públicas disponíveis na web e foram coletadas em hospitais do Brasil e do exterior.

Essas imagens foram utilizadas no treinamento de redes neurais convolucionais como a VGG, ResNET50 e EfficientNet, a fim de identificar se o indivíduo apresenta uma enfermidade e, em caso positivo, diferenciar a Covid-19 das demais pneumonias. “As redes neurais convolucionais são uma classe de rede neural que vem sendo empregada com sucesso na análise de imagens. Esses algoritmos são inspirados no córtex visual dos animais, os quais respondem a estímulos apenas em regiões restritas do campo de visão. Existem diferentes algoritmos propostos na literatura, como a VGG, ResNET50 e EfficientNet, os quais foram usados no trabalho por serem bastante famosos”, pontua o aluno da Unifesp.

A metodologia adotada envolve o processamento dos dados, que abrange o redimensionamento das imagens e remoção de imagens duplicadas entre outros tratamentos. Depois, os dados são divididos em três conjuntos: treino, validação e teste. O conjunto de treino é passado para as redes neurais aprenderem os padrões. O conjunto de validação é aplicado após o treinamento para avaliar a acurácia obtida e, quando necessário, reajustar os parâmetros dos algoritmos. Por último, é usado o conjunto de teste para validar a efetividade do algoritmo. “Existem métricas estatísticas que são comumente computadas para avaliar algoritmos de aprendizado de máquina, as quais foram empregadas no trabalho. Uma vez identificado o melhor modelo de rede neural convolucional, ele foi usado no sistema web”, esclarece a professora Lilian.

Por meio de um site, o usuário faz login e o upload de uma imagem de raios X. O sistema usa uma rede neural convolucional treinada em outros dados e faz a classificação dessa nova imagem indicando se seria de um paciente saudável, com pneumonia ou com Covid-19.

O sistema foi aplicado em uma base de dados externa, a qual não foi utilizada no treinamento das redes neurais e alcançou 95% de acurácia. Os dados são do Hospital da Cruz Vermelha em Curitiba (PR) e podem ser acessados neste link.

Redação

Redação

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.