Quais são os principais métodos que uma nova biblioteca de Data Science precisaria ter para ser útil ?
Eu estou desenvolvendo um projeto Open Source no GitHub, uma biblioteca para Data Science.
LINK: https://github.com/WilliamJardim/Analise
Por enquanto, ele pode:
- Pesquisar amostras com base em critérios de busca
- Inserir e deletar amostras,
- Substituir valores nas colunas
- Criar novas colunas,
- Criar colunas calculadas usando fórmulas
- Importar e Exportar dados via JSON e CSV
- Converter o objeto para uma Matriz com funções matemáticas
- Juntar duas tabelas com comando "mergeWith "
- Eliminar amostras duplicadas com o distinct
Quero melhorar esse projeto adicionando mais coisas úteis, mais preciso de dicas do que adicionar.
Eu estou na dúvida sobre quais métodos eu precisaria implementar para que minha biblioteca tivesse as capacidades de ser útil para uso em Analise de dados. Então, eu gostaria muito ouvir a opinião de vocês meus instrutores, para ver o que vocês acham.