Olá Claudia, tudo bem? Espero que sim!
O método train_test_split
irá separar o conjunto de dados entre dados de treinamento e dados de teste para que você consiga treinar o seu modelo com os dados de treinamento e validar o modelo com os dados de teste.
A separação entre variáveis explicativas ( X ) e a variável alvo ( y ) deve ser feita antes do uso do método train_test_split
, para que sejam passadas como argumento da função. Portanto a variável alvo ( y ) no seu exemplo é a quantidade de ônibus, enquanto as variáveis explicativas são as variáveis utilizadas para encontrar a quantidade de ônibus. Como a regressão se trata de uma modelagem supervisionada, é necessário que o conjunto de dados sejam rotulados, com uma coluna contendo a variável quantidade de ônibus de registros passados.
Após a divisão entre variáveis explicativas e a variável alvo, você pode utilizar o train_test_split
para dividir o conjunto de dados entre treinamento e teste, como no código a seguir:
X_train, X_test, y_train, y_test = train_test_split(X, y)
O método retorna 4 resultados:
- O X_train são os dados de treinamento das variáveis explicativas.
- O X_test é a variável alvo para os dados de treinamento.
- O y_train são os dados de teste das variáveis explicativas.
- O y_test é a variável alvo para os dados de teste.
Espero que tenha tirado sua dúvida.
Bons estudos!