Onde X é o nosso conjunto de variáveis explicativas, y a nossa variável dependente e test_size o percentual da base que desejamos separar para testes, no caso acima, 30%.
essa parte está invertida, ao menos em aula a variável X é a Series com a variável dependente e em y está o DataFrame com as variáveis explicativas.