Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

[Dúvida] Tipo 'str' é boa prática na entrada de dados em ciência de dados?

Estou com uma dúvida que pode parecer simples, mas que me pegou pensando...

Sabemos que em Python, ao utilizar a função 'input()', o dado inserido pelo usuário é sempre interpretado inicialmente como 'str', a não ser que a gente converta para um 'int', 'float' ou 'bool'. Então, fiquei me perguntando: Será que é uma boa prática usar o tipo 'str' nas variáveis em ciência de dados, principalmente nas etapas iniciais de entrada ou coleta de dados, já que muita coisa chega em formato de texto?

Minha dúvida está mais relacionada ao uso do tipo da variável 'str' em processos de ciência de dados e se isso é comum ou se deve ser evitado dependendo da etapa ou do objetivo.

1 resposta
solução!

Ei, Gabriel! Tudo bem?

Adorei sua reflexão, obrigada por compartilhar com a gente!

Sim, é uma prática comum. Por sempre "chegar" como dados brutos, é bom se atentar em não manter tudo como str, para não complicar análises posteriores. Outra boa prática é, depois, converter esses dados para outros tipos, como int, float ou bool, se necessário.

Para exemplificar, suponha que em um dataset com idades, que chegam como texto, você pode começar armazenando-os como str e depois convertê-los para int assim que tiver certeza de que todos os valores são válidos e podem ser convertidos sem erros.

Continue se dedicando aos estudos e qualquer dúvida, compartilhe no fórum.

Caso este post tenha lhe ajudado, por favor, marcar como solucionado!