Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

[Dúvida] Quais são os principais métodos que uma nova biblioteca de Data Science precisaria ter para ser útil ?

Quais são os principais métodos que uma nova biblioteca de Data Science precisaria ter para ser útil ?

Eu estou desenvolvendo um projeto Open Source no GitHub, uma biblioteca para Data Science.

LINK: https://github.com/WilliamJardim/Analise

Por enquanto, ele pode:

  • Pesquisar amostras com base em critérios de busca
  • Inserir e deletar amostras,
  • Substituir valores nas colunas
  • Criar novas colunas,
  • Criar colunas calculadas usando fórmulas
  • Importar e Exportar dados via JSON e CSV
  • Converter o objeto para uma Matriz com funções matemáticas
  • Juntar duas tabelas com comando "mergeWith "
  • Eliminar amostras duplicadas com o distinct

Quero melhorar esse projeto adicionando mais coisas úteis, mais preciso de dicas do que adicionar.

Eu estou na dúvida sobre quais métodos eu precisaria implementar para que minha biblioteca tivesse as capacidades de ser útil para uso em Analise de dados. Então, eu gostaria muito ouvir a opinião de vocês meus instrutores, para ver o que vocês acham.

2 respostas
solução!

Olá William, tudo bem?

Parabéns pelo seu projeto e pela iniciativa de criar uma biblioteca open source para Data Science.

Os métodos que você já implementou são muito úteis e formam uma boa base. Para decidir o que adicionar, é importante entender o objetivo da sua biblioteca: será mais focada em simplificar tarefas para iniciantes, realizar análises complexas ou otimizar fluxos de trabalho específicos? Você deverá ter mente as respostas claras para essas questões.

Então, dependendo disso, você pode considerar implementar métodos como:

  • Análise Estatística: funções para calcular médias, medianas, variâncias e correlações.
  • Visualização Simples: gráficos básicos integrados (barras, linhas ou dispersão) para análises rápidas.
  • Integração com Outras Ferramentas: compatibilidade com bibliotecas como Pandas ou NumPy.
  • Automação de Processos: criar pipelines para tarefas repetitivas.

Enfim... entender o que os usuários esperam da sua biblioteca é essencial para guiar o desenvolvimento.

Espero ter ajudado e sucesso no projeto!

Abraços!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado

Obrigado Monalisa pelas dicas!