Refiz a aula no notebook e consegui os resultados esperados. Agradeço a clareza nas informações, pois passa muita segurança e esse passo a passo no incio é importante!
Refiz a aula no notebook e consegui os resultados esperados. Agradeço a clareza nas informações, pois passa muita segurança e esse passo a passo no incio é importante!
Olá, Pedro! Tudo bem?
Que satisfação ver o seu progresso com o tratamento de Strings! Esse domínio sobre a manipulação de textos é uma das habilidades mais valiosas para um Analista de Dados, pois grande parte do nosso trabalho envolve a "limpeza" (o famoso data cleaning) de nomes, categorias e descrições.
Analisando a sua prática no Google Colab, você aplicou com perfeição os quatro métodos fundamentais de limpeza:
str.upper() e str.lower(): Você converteu com sucesso o nome para maiúsculas e minúsculas. Isso é essencial para padronizar dados, evitando que o Python entenda "Pedro" e "pedro" como duas pessoas diferentes.str.strip(): Note como o resultado ficou muito mais limpo! Esse método é o "herói invisível" que remove espaços desnecessários no início e no fim, que costumam causar erros em buscas em bancos de dados.str.replace(antigo, novo): Sua substituição de 'y' por 't' para corrigir o sobrenome "Sanyos" para "Santos" foi precisa. Em Data Science, usamos muito isso para trocar vírgulas por pontos em preços ou remover símbolos especiais.Pedro, existe um conceito sobre strings que costuma pegar muita gente de surpresa no início: as strings em Python são imutáveis.
Isso significa que quando você roda texto.strip(), o Python não altera a variável texto original; ele cria uma cópia limpa na memória. Se você quiser que o nome "Sanyos" vire "Santos" permanentemente na sua variável, você precisa "atribuir" o resultado de volta:
# Para salvar a correção permanentemente:
texto = texto.replace('y', 't')
Se você apenas rodar o comando sem o texto = ..., na próxima célula que você usar a variável texto, ela ainda estará com o "y" original.
Fico muito feliz que o passo a passo esteja te passando segurança. Esse é exatamente o objetivo: construir uma base sólida para que, quando chegarmos em grandes volumes de dados, esses comandos já estejam na ponta dos seus dedos!
Uma pergunta para o seu próximo teste: Você já tentou encadear os métodos? Por exemplo: texto.strip().lower(). O que você acha que acontece se rodar dois comandos juntos assim?