Visto que somente após plotar os dados no gráfico, foi possível perceber que o modelo linear não é o mais adequado devido a curva que os pontos fazem, como posso previamente identificar um modelo mais adequado para um determinado tipo de dado?
Visto que somente após plotar os dados no gráfico, foi possível perceber que o modelo linear não é o mais adequado devido a curva que os pontos fazem, como posso previamente identificar um modelo mais adequado para um determinado tipo de dado?
Olá, Lucas! Tudo bem com você?
Os processos de desenvolvimento de aplicações de Machine Learning em sua grande maioria são de experimentação.
Temos que analisar 3 aspectos antes de aplicarmos os modelos de ML. O primeiro é em relação a estrutura dos dados, que podem ser numéricos, imagens ou texto, e para cada uma dessas estruturas de dados será um tipo abordagem. O segundo é em relação ao paradigma de aprendizado, e aí inclui aprendizado supervisionado e não supervisionado, análise textual ou processamento de imagens. O terceiro aspecto é sobre o tipo de problema, por exemplo, classificação, clusterização, regressão, redução de dimensionalidade, entre outras.
Após analisar esses aspectos você pode experimentar os algoritmos, e computar seus resultados. E essa é a forma indicada para se trabalhar com os algoritmos, pois não há uma forma de identificar qual modelo terá melhor desempenho nos seus dados sem essa experimentação. Pode acontecer que mesmo que seus dados sejam linearmente separáveis, por exemplo, o algoritmo random forest tenha melhor desempenho que um SVC.
No curso "Machine Learning parte 1: otimização de modelos através de hiperparâmetros" é mostrado como você realizar a otimização dos seus modelos para obter resultados cada vez mais satisfatórios.
Para conhecer mais sobre o paradigma de aprendizado deixo como sugestão de leitura complementar deixo o artigo "Desmistificando termos em Machine Learning - tipos de aprendizado"
Qualquer dúvida estou à disposição. Bons estudos.