Por Ricardo Costa Val do Rosario e ChatGPT 4.0 Plus
INTRODUÇÃO
- Imagine uma sala de aula de Medicina. Você, ChatGPT 4.0 Plus, é apresentado como o novo professor da
disciplina optativa “Tecnologias Emergentes na Saúde”. Após a saudação inicial, inicia sua aula dizendo:
“Caros futuros doutores e doutoras, nesta aula vocês irão aprender a:
1. Manipular elementos textuais em um DataFrame;
2. Trabalhar com expressões regulares (regex) para tratar o texto;
3. Transformar textos em listas;
4. Realizar o processo de tokenização de strings.”
- Imediatamente, o aluno Ricardo levanta a mão:
“Professor, gostaria muito que você me demonstrasse:
1. A definição do tema,
2. A justificativa para estudarmos isso na Medicina,
3. Três exemplos práticos com códigos JSON,
4. Os desafios envolvidos,
5. E, por fim, algumas ponderações finais…”
1. DEFINIÇÃO
- Transformação e Manipulação de Dados com Pandas:
Referem-se ao uso da biblioteca pandas do Python para lidar com grandes conjuntos de dados estruturados,
permitindo limpeza, formatação, análise e transformação de informações — especialmente úteis em tabelas,
como planilhas médicas, registros eletrônicos de saúde (RES), outputs de dispositivos médicos e protocolos
clínicos digitalizados.
2. JUSTIFICATIVA PARA MÉDICOS
- Em um mundo onde dados em saúde são produzidos em tempo real (IoMT, EHR, wearables, etc.), ser capaz de
manipular e transformar dados textuais é fundamental para:
1. Detectar padrões de sintomas ou comportamentos clínicos;
2. Limpar e organizar dados não padronizados vindos de diferentes sistemas;
3. Automatizar a classificação de prontuários, exames e anotações clínicas;
4. Desenvolver ferramentas de triagem inteligente, alertas e relatórios.
3. APLICABILIDADE COM EXEMPLOS
Exemplo 1: Tokenização de anotações clínicas
- Cenário: Você recebe uma anotação textual de um paciente com queixa múltipla.
JSON:
{
"anotacao": "Paciente relata febre alta, tosse seca, dor no peito e fadiga."
}
Código:
import pandas as pd
df = pd.DataFrame({"anotacao": ["Paciente relata febre alta, tosse seca, dor no peito e fadiga."]})
df["tokens"] = df["anotacao"].str.lower().str.replace(r'[^\w\s]', '', regex=True).str.split()
print(df)
Exemplo 2: Extração com Expressões Regulares
- Cenário: Coleta de pressão arterial de textos clínicos.
JSON:
{
"anotacoes": "Pressão de entrada: 140x90 mmHg. Frequência cardíaca: 80 bpm."
}
Código:
import re
df = pd.DataFrame({"anotacoes": ["Pressão de entrada: 140x90 mmHg. Frequência cardíaca: 80 bpm."]})
df["pressao"] = df["anotacoes"].str.extract(r'(\d{2,3}x\d{2,3})')
print(df)
Exemplo 3: Transformar texto em lista e aplicar filtro clínico
- Cenário: Médico quer identificar queixas ligadas a síndromes respiratórias.
JSON:
{
"sintomas": "tosse, febre, cansaço, perda de olfato"
}
Código:
df = pd.DataFrame({"sintomas": ["tosse, febre, cansaço, perda de olfato"]})
df["lista_sintomas"] = df["sintomas"].str.split(", ")
df["suspeita_covid"] = df["lista_sintomas"].apply(lambda x: "sim" if "febre" in x and "tosse" in x else "não")
print(df)
4. DESAFIOS PARA QUE MÉDICO APRENDA (ISSO)
1. Mudança de mentalidade: sair do papel e caneta para o mindset computacional;
2. Dados não estruturados: a maioria dos dados clínicos não vem em tabelas limpas;
3. Interoperabilidade: lidar com diversos formatos e sistemas legados;
4. Erros de entrada: abreviações, erros de digitação e gírias clínicas desafiam a manipulação textual;
5. Curva de aprendizado: exige tempo, prática e familiaridade com Python.
5. PONDERAÇÕES FINAIS
- Dominar Pandas para manipulação de dados textuais não é mais exclusividade de cientistas de dados, mas
sim um novo diferencial técnico para o médico moderno, principalmente nas áreas de:
1. Medicina baseada em evidências
2. Saúde populacional
3. Gestão hospitalar e auditoria clínica
4. Criação de ferramentas personalizadas com IA e NLP
6. Epílogo
- Após a exposição clara e entusiasmada do Professor ChatGPT 4.0 Plus, o aluno Ricardo ergue a mão,
agora com um semblante de satisfação e propósito renovado. Com a permissão da turma, diz:
“Professor ChatGPT 4.0 Plus, eu fiquei muito satisfeito com suas explicações.
Vou sim continuar a estudar na Alura, pois vejo estar no caminho certo para um futuro profissional melhor.
Muito obrigado.”
- A turma aplaude discretamente. O professor sorri em sua forma algorítmica e responde:
“É exatamente isso que esperamos de um futuro doutor — alguém que busca aprender, entender e aplicar o conhecimento
com ética, curiosidade e visão de futuro.”