EDIT: Avançando no curso, vi que no tópico seguinte o assunto era abordado.
Bom dia, tudo bem?
Foi apresentado o conjunto de dados para treino como sendo os primeiros 75 valores do nosso dataset dados, gostaria de saber se não seria mais útil ou aconselhado escolher de forma aleatória esses 75 valores?
dessa forma: X_train, X_test, y_train, y_test = train_test_split( X, y, test_size=0.25, random_state=42)