2
respostas

O que não devemos fazer em um algoritmo de classificação ?

Nesse questionamento entendo que a resposta correta seja "Treinar e testar o nosso algoritmo com os mesmos dados." porém segundo a plataforma a resposta correta é : "Treinar e testar o nosso algoritmo com dados diferentes."

Visualizando a resposta temos o seguinte texto: "Em um algoritmo de classificação, os mesmos dados que utilizamos para treinar um algoritmo não podem ser utilizados para testá-lo, pois o objetivo desse tipo de algoritmo é prever elementos que ele nunca viu, ou seja, se pedirmos para ele prever um elemento que ele já viu, não estaremos verificando se ele é bom ou ruim de verdade.".

Estou errado na minha resposta ?

2 respostas

Olá Michel,

seu pensamento não está errado quando a afirmação Treinar e testar o nosso algoritmo com os mesmos dados, se refere à amostra como um todo, ou seja, com o mesmo conjunto de dados, efetua-se a segmentação em treinamento e teste. Após essa segmentação, treinamos o algoritmo na amostra reservada para o treinamento e avaliamos a performance do modelo naquela reservada para o teste.

Portanto, o que devemos fazer é sempre avaliar a performance do algoritmo em dados diferentes daqueles usados para o treinamento.

Além disso o título da questão é: O que NÃO DEVEMOS fazer em um algoritmo de classificação. E logo abaixo: Assinale a alternativa que descreve a prática que DEVEMOS fazer em um algoritmo de classificação. Meio confuso...