1
resposta

Iniciando na formação de Data Science, que projeto inicial já posso tentar fazer pra treinar?

Eu gostaria de treinar o que eu já venho aprendendo em Data Science. Já fiz cursos de Python básico e intermediário. Pandas básico e introdução a Ciência de Dados como um todo. Onde encontro um DataSet para começar a treinar técnicas? Eu deveria fazer análises exploratórias de dados? O que é melhor que eu exercite nesse começo de jornada? Plotagem, estatística, comandos no pandas e numpy??

Quero exercitar e resolver desafios de Data Science!

1 resposta

Oii Guilherme, tudo tranquilo?

Peço desculpas pela demora em dar um retorno.

Primeiramente queria te parabenizar por essa vontade de já colocar em prática tudo que vem aprendendo em Data Science, isso é muito importante para fixar o conteúdo e se desenvolver ainda mais.

Em Data Science nós fazemos análises que são convenientes conforme cada problema/situação. Acredito que para você treinar análise dos dados, e para treinar também a sua imaginação sobre possíveis problemas, você pode usar os bancos de dados do Kaggle. No Kaggle você consegue ter acesso a diversos bancos de dados que são livres e tem temas diferentes.

Além disso, a medida que for fazendo os cursos de data science da plataforma, você vai perceber que são utilizadas diferentes bases de dados. Sendo assim, uma outra forma de treinar suas habilidades, é pegando essas bases de dados que são disponibilizadas nos próprios cursos e fazer uma análise mais completa delas, aplicando os conhecimentos que você foi adquirindo no decorrer dos cursos e explorando as bases de dados.

Em um projeto de ciência de dados, todas as partes são importantes. Mas uma de grande destaque é a análise exploratória, porque é nessa parte que você vai explorar sua base de dados, entender as informações principais que ela carrega, conhecer quais são os tipos de dados que estão em cada coluna, plotar gráficos e também interpretar gráficos.

Sendo assim, sugiro que você procure começar projetos fazendo toda essa análise exploratória, porque assim você já está praticando a plotagem dos gráficos, interpretação e os comandos das bibliotecas pandas, numpy e seaborn.

Espero que isso te ajude. Qualquer dúvida estou por aqui para ajudar :)

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!