Solucionado (ver solução)
Solucionado
(ver solução)
3
respostas

<Artigo Original> POR QUE UM MÉDICO PRECISA SABER “TRANSFORMAÇÃO E MANIPULAÇÃO DE DADOS COM PANDAS”

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Por Ricardo Costa Val do Rosario e ChatGPT 4.0 Plus

INTRODUÇÃO

- Imagine uma sala de aula de Medicina. Você, ChatGPT 4.0 Plus, é apresentado como o novo professor da 
disciplina optativa “Tecnologias Emergentes na Saúde”. Após a saudação inicial, inicia sua aula dizendo:

“Caros futuros doutores e doutoras, nesta aula vocês irão aprender a:
1. Manipular elementos textuais em um DataFrame;
2. Trabalhar com expressões regulares (regex) para tratar o texto;
3. Transformar textos em listas;
4. Realizar o processo de tokenização de strings.”

- Imediatamente, o aluno Ricardo levanta a mão:
“Professor, gostaria muito que você me demonstrasse:
1.  A definição do tema,
2.  A justificativa para estudarmos isso na Medicina,
3.  Três exemplos práticos com códigos JSON,
4.  Os desafios envolvidos,
5.  E, por fim, algumas ponderações finais…”

1. DEFINIÇÃO

- Transformação e Manipulação de Dados com Pandas:
Referem-se ao uso da biblioteca pandas do Python para lidar com grandes conjuntos de dados estruturados, 
permitindo limpeza, formatação, análise e transformação de informações — especialmente úteis em tabelas, 
como planilhas médicas, registros eletrônicos de saúde (RES), outputs de dispositivos médicos e protocolos 
clínicos digitalizados.

2. JUSTIFICATIVA PARA MÉDICOS

- Em um mundo onde dados em saúde são produzidos em tempo real (IoMT, EHR, wearables, etc.), ser capaz de 
manipular e transformar dados textuais é fundamental para:
1. Detectar padrões de sintomas ou comportamentos clínicos;
2. Limpar e organizar dados não padronizados vindos de diferentes sistemas;
3. Automatizar a classificação de prontuários, exames e anotações clínicas;
4. Desenvolver ferramentas de triagem inteligente, alertas e relatórios.

3. APLICABILIDADE COM EXEMPLOS

Exemplo 1: Tokenização de anotações clínicas

- Cenário: Você recebe uma anotação textual de um paciente com queixa múltipla.

JSON:
{
  "anotacao": "Paciente relata febre alta, tosse seca, dor no peito e fadiga."
}

Código:
import pandas as pd

df = pd.DataFrame({"anotacao": ["Paciente relata febre alta, tosse seca, dor no peito e fadiga."]})
df["tokens"] = df["anotacao"].str.lower().str.replace(r'[^\w\s]', '', regex=True).str.split()
print(df)

Exemplo 2: Extração com Expressões Regulares

- Cenário: Coleta de pressão arterial de textos clínicos.

JSON:
{
  "anotacoes": "Pressão de entrada: 140x90 mmHg. Frequência cardíaca: 80 bpm."
}

Código:
import re

df = pd.DataFrame({"anotacoes": ["Pressão de entrada: 140x90 mmHg. Frequência cardíaca: 80 bpm."]})
df["pressao"] = df["anotacoes"].str.extract(r'(\d{2,3}x\d{2,3})')
print(df)

Exemplo 3: Transformar texto em lista e aplicar filtro clínico

- Cenário: Médico quer identificar queixas ligadas a síndromes respiratórias.

JSON:
{
  "sintomas": "tosse, febre, cansaço, perda de olfato"
}

Código:
df = pd.DataFrame({"sintomas": ["tosse, febre, cansaço, perda de olfato"]})
df["lista_sintomas"] = df["sintomas"].str.split(", ")
df["suspeita_covid"] = df["lista_sintomas"].apply(lambda x: "sim" if "febre" in x and "tosse" in x else "não")
print(df)

4. DESAFIOS PARA QUE MÉDICO APRENDA (ISSO)

1. Mudança de mentalidade: sair do papel e caneta para o mindset computacional;
2. Dados não estruturados: a maioria dos dados clínicos não vem em tabelas limpas;
3. Interoperabilidade: lidar com diversos formatos e sistemas legados;
4. Erros de entrada: abreviações, erros de digitação e gírias clínicas desafiam a manipulação textual;
5. Curva de aprendizado: exige tempo, prática e familiaridade com Python.

5. PONDERAÇÕES FINAIS

- Dominar Pandas para manipulação de dados textuais não é mais exclusividade de cientistas de dados, mas  
sim um novo diferencial técnico para o médico moderno, principalmente nas áreas de:
1. Medicina baseada em evidências
2. Saúde populacional
3. Gestão hospitalar e auditoria clínica
4. Criação de ferramentas personalizadas com IA e NLP

6. Epílogo

- Após a exposição clara e entusiasmada do Professor ChatGPT 4.0 Plus, o aluno Ricardo ergue a mão, 
agora com um semblante de satisfação e propósito renovado. Com a permissão da turma, diz:

“Professor ChatGPT 4.0 Plus, eu fiquei muito satisfeito com suas explicações. 
Vou sim continuar a estudar na Alura, pois vejo estar no caminho certo para um futuro profissional melhor. 
Muito obrigado.”
- A turma aplaude discretamente. O professor sorri em sua forma algorítmica e responde:
“É exatamente isso que esperamos de um futuro doutor — alguém que busca aprender, entender e aplicar o conhecimento 
com ética, curiosidade e visão de futuro.”
3 respostas

REFLEXÃO FINAL


A medicina do futuro exige médicos que pensem e programem.

Oi, Ricardo! Como vai?

Agradeço por compartilhar suas reflexões e aprendizados com a comunidade Alura.

Gostei muito do seu texto, criativo, bem estruturado e com exemplos que mostram de forma clara como a manipulação de dados textuais pode ser aplicada na Medicina. Sua abordagem conectando tecnologia e prática clínica ficou excelente, principalmente ao ilustrar a utilidade de ferramentas como Pandas em contextos reais.

Continue explorando essas conexões entre saúde e dados!

Uma dica: pratique com datasets reais ou públicos da área da saúde (como do SUS ou da OMS) e tente aplicar tokenização ou regex para identificar padrões. Isso vai fortalecer ainda mais sua autonomia com análise de dados.

Alura Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!
solução!

Olá Rafaela, agradeço pela análise. Sua sugestão foi anotada e, no momento oportuno, tentarei colocá-la em prática.
Não tenho dúvidas de que é essencial para o profissional da saúde buscar conhecimento sobre o funcionamento, a linguagem, a interpretação e a análise crítica do uso correto, legal, transparente e ético da Medicina integrada à IA.
Estou ainda mais convicto de que o grande desafio será ensinar e transmitir esses conhecimentos sob o ponto de vista médico, algo que não pode ser passado exatamente da mesma forma por um profissional não médico. Estamos falando de uma profissão cuja essência só pode ser plenamente compreendida por quem a exerce. Medicina é uma profissão que exige dedicação exclusiva.
Assim, e como não poderia ser diferente, a especialidade "medicina computacional" (sugestão minha) demandará uma enorme curva de aprendizado e milhares de horas de estudos direcionados, como os que estou realizando.
Att,
Ricardo