No vídeo [10:50] o André fala que os dados de treino seriam realizados em cima das variáveis independentes e os dados de teste em cima das variáveis dependentes. Mas no código: treino, teste, treino_bilheteria, teste_bilheteria = train_test_split(filmes_investimento, filmes_bilheteria, test_size=0.10), os dados de treino são divididos considerando as variáveis dependentes e independentes, assim como os dados de teste. Fiquei um pouco confusa no que ele quis dizer. Alguém consegue me ajudar? Obrigada!