Oi, Cauê! Tudo bom contigo?
Primeiro, gostaria de pedir desculpas pela demora em te responder.
Depois que seu modelo estiver treinado é recomendado que faça um teste para medir quão bem treinado está o modelo, se ele é confiável o suficiente para aquela aplicação. É a partir desse teste, que você vai ajustando seu modelo para se tornar cada vez melhor para sua aplicação.
Quando você ver que seu modelo chegou em um nível de aprendizado bom, você pode buscar um banco de dados na internet, ou montar o seu próprio banco com dados reais e únicos para que seu programa analise e dê um bom resultado. O importante é somente se atentar aos valores de entrada enviados ao seu modelo, pois é interessante que eles sejam equivalentes aos tipos de dados utilizados na aprendizagem, por exemplo, se você treinou o seu modelo para diferenciar um porco de um cachorro a partir dos tamanhos de perna, rabo e focinho, o novo banco de dados precisa conter as mesmas informações (tamanhos de perna, rabo e focinho). Esse cuidado visa promover um bom resultado para as avaliações dos novos dados entregues para o programa.
Você pode procurar datasets no Kaggle, lá você encontra diversos temas de datasets, desde os mais simples até os mais avançados, tanto com imagens, arquivos csv, textos, entre outros. No artigo intitulado Os 7 melhores sites para encontrar datasets para projetos de Data Science você encontra outros lugares para encontrar datasets bacanas para os projetos de data science.
Eu espero ter te ajudado! Se surgir outra dúvida estarei à disposição ;-)
Bons estudos!
Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!