[Dúvida] Quais são os principais métodos que uma nova biblioteca de Data Science precisaria ter para ser útil ?

Solucionado (ver solução)

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

Solucionado
(ver solução)

2
respostas

por William Alves Jardim

| 224.9k xp | 91 posts

Quais são os principais métodos que uma nova biblioteca de Data Science precisaria ter para ser útil ?

Eu estou desenvolvendo um projeto Open Source no GitHub, uma biblioteca para Data Science.

LINK: https://github.com/WilliamJardim/Analise

Por enquanto, ele pode:

Pesquisar amostras com base em critérios de busca
Inserir e deletar amostras,
Substituir valores nas colunas
Criar novas colunas,
Criar colunas calculadas usando fórmulas
Importar e Exportar dados via JSON e CSV
Converter o objeto para uma Matriz com funções matemáticas
Juntar duas tabelas com comando "mergeWith "
Eliminar amostras duplicadas com o distinct

Quero melhorar esse projeto adicionando mais coisas úteis, mais preciso de dicas do que adicionar.

Eu estou na dúvida sobre quais métodos eu precisaria implementar para que minha biblioteca tivesse as capacidades de ser útil para uso em Analise de dados. Então, eu gostaria muito ouvir a opinião de vocês meus instrutores, para ver o que vocês acham.

2 respostas

solução!

por Monalisa Meyrelle de Sousa Silva

| 4183.6k xp | 9648 posts

Alura Scuba Team

10/12/2024

Olá William, tudo bem?

Parabéns pelo seu projeto e pela iniciativa de criar uma biblioteca open source para Data Science.

Os métodos que você já implementou são muito úteis e formam uma boa base. Para decidir o que adicionar, é importante entender o objetivo da sua biblioteca: será mais focada em simplificar tarefas para iniciantes, realizar análises complexas ou otimizar fluxos de trabalho específicos? Você deverá ter mente as respostas claras para essas questões.

Então, dependendo disso, você pode considerar implementar métodos como:

Análise Estatística: funções para calcular médias, medianas, variâncias e correlações.
Visualização Simples: gráficos básicos integrados (barras, linhas ou dispersão) para análises rápidas.
Integração com Outras Ferramentas: compatibilidade com bibliotecas como Pandas ou NumPy.
Automação de Processos: criar pipelines para tarefas repetitivas.

Enfim... entender o que os usuários esperam da sua biblioteca é essencial para guiar o desenvolvimento.

Espero ter ajudado e sucesso no projeto!

Abraços!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado

por William Alves Jardim

| 224.9k xp | 91 posts

11/12/2024

Obrigado Monalisa pelas dicas!

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP