1
resposta

Dataframe

Não estou localizando o dataframe utilizado para a DecisionTreeClassifier. O arquivo disponível apresenta erro pois a variável y é continua. Acredito que só funcione para previsões com variáveis categóricas.

Utilizando o arquivo

dados = pd.read_csv('movies_multilinear_reg.csv')

ao "fitar" retorna o seguinte erro:

ValueError: Unknown label type: 'continuous'

Me ajudem por favor.

1 resposta

Olá Lucas, tudo bem? Espero que sim!

Desculpe pela demora em retornar.

O arquivo para realização da atividade não é o movies_multilinear_reg.csv. Esse arquivo é destinado para realização de regressão, e com isso poderia ser utilizada a DecisionTreeRegressor, nesse caso a variável y é uma variável numérica contínua.

Para o caso da atividade, a variável y precisa ser do tipo categórica, e o arquivo correto é o avaliacoes_usuario.csv. O valor que irá predizer é gostou ou não gostou (0 e 1), presente na última coluna dos dados.

Você pode realizar o download dos arquivos do curso contendo o conjunto de dados através desse link, que está na atividade 03 - Download de Notebooks da aula 01 do curso. Os dados estão contidos na pasta datasets, e estão incluídos todas as bases de dados usadas no curso, incluindo movies_multilinear_reg.csv e avaliacoes_usuario.csv.

Espero que tenha tirado sua dúvida.

Estou à disposição. Bons estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software