Classificação de mensagens digitais de pacientes para busca ativa em saúde utilizando IA
- Agile Health Tech 
- 5 de jun.
- 2 min de leitura

A comunicação por mensagens eletrônicas tem se tornado uma ferramenta essencial em diversos serviços de saúde, permitindo a interação direta com pacientes e o monitoramento de suas necessidades. Este estudo propõe um sistema de busca ativa de pacientes, onde mensagens digitais são automaticamente classificadas para determinar a necessidade de intervenção humana, otimizando o fluxo de atendimento e priorizando casos que demandam atenção especializada.
A pesquisa utilizou uma base de dados desbalanceada, representando mensagens de pacientes classificadas em duas categorias: aquelas que podem ser respondidas automaticamente e aquelas que exigem intervenção humana. Para mitigar o desbalanceamento, o modelo de linguagem ChatGPT 3.5 foi empregado para gerar dados sintéticos, expandindo a classe minoritária. Três cenários foram comparados: dados originais desbalanceados, dados sintéticos sem erros linguísticos e dados sintéticos com erros simulados, visando avaliar o impacto da qualidade dos dados no desempenho do modelo. O algoritmo XGBoost foi utilizado em todos os cenários para classificação das mensagens.
Materiais e Métodos:
Base de dados: Conjunto de mensagens eletrônicas de pacientes, rotuladas quanto à necessidade de intervenção humana.
Geração de dados sintéticos: Utilização do ChatGPT 3.5 para expandir a classe minoritária, com e sem simulação de erros linguísticos.
Algoritmo de classificação: XGBoost, um algoritmo de aprendizado de máquina supervisionado.
Avaliação de desempenho: Comparação do desempenho do XGBoost nos três cenários, utilizando métricas de classificação como acurácia, precisão, recall e F1-score.
Resultados:
O cenário que apresentou o melhor desempenho do XGBoost na discriminação das mensagens foi aquele treinado com a base de dados contendo mensagens sintéticas geradas pelo ChatGPT sem erros de português. Este resultado sugere que a qualidade dos dados de treinamento é crucial para a eficácia do modelo de classificação, e que a geração de dados sintéticos por modelos de linguagem pode ser uma estratégia eficaz para lidar com o desbalanceamento de classes em conjuntos de dados textuais.
Discussão:
A capacidade de classificar automaticamente mensagens de pacientes com precisão pode otimizar significativamente os fluxos de trabalho em serviços de saúde, permitindo uma resposta mais rápida e eficiente às necessidades dos pacientes. A utilização de dados sintéticos gerados por modelos de linguagem, como o ChatGPT, demonstra potencial para melhorar o desempenho de modelos de aprendizado de máquina em cenários de dados desbalanceados.
Conclusão:
O estudo demonstra a viabilidade e eficácia da utilização do algoritmo XGBoost, otimizado com dados sintéticos gerados por ChatGPT, para a classificação de mensagens de pacientes em um contexto de busca ativa em saúde. A capacidade de discriminar automaticamente entre mensagens que exigem intervenção humana e aquelas que podem ser respondidas automaticamente representa um avanço significativo na otimização da comunicação e do atendimento em serviços de saúde.
* NAVEGAÇÃO DIGITAL VIA WHATSAPP APOIADA POR INTELIGÊNCA ARTIFICIAL: UM MODELO VIÁVEL PARA O CUIDADO DE IDOSOS. Finalista do Prêmio Unidas.
Saiba mais sobre o assunto! Conheça a Agile Health Tech.




Comentários