Ainda não tem acesso? Estude com a gente! Matricule-se
Ainda não tem acesso? Estude com a gente! Matricule-se

Solucionado (ver solução)

Modelo de treino

No vídeo [10:50] o André fala que os dados de treino seriam realizados em cima das variáveis independentes e os dados de teste em cima das variáveis dependentes. Mas no código: treino, teste, treino_bilheteria, teste_bilheteria = train_test_split(filmes_investimento, filmes_bilheteria, test_size=0.10), os dados de treino são divididos considerando as variáveis dependentes e independentes, assim como os dados de teste. Fiquei um pouco confusa no que ele quis dizer. Alguém consegue me ajudar? Obrigada!

1 resposta
solução

Oi Yukiko,

Concordo com você. Acho que o André se enganou.

Variáveis independentes (também chamadas de features ou variáveis de entrada) e variáveis dependentes (também chamada de output ou variável de saída) pertencem ao mesmo conjunto de dados.

O processo de segmentação, separa os dados em treino e teste, nos quais ambos apresentam o mesmo conjunto de variáveis independentes e dependente, diferenciando entre si apenas pela quantidade de instâncias em cada.

Abs