Olá hoiama, tudo bem? Espero que sim!
Desculpe pela demora em retornar.
Ao utilizar outra base de dados, você deve avaliar se o modelo pode ser aplicado da mesma forma que foi com os dados utilizados no curso.
Os seus dados possivelmente possuem uma dimensionalidade diferente. Portanto, a separação entre treino e teste não será mais de 75 dados para o treino e o restante para os dados de teste, como no código da aula:
treino_x = x[:75]
treino_y = y[:75]
teste_x = x[75:]
teste_y = y[75:]
Outro ponto a se considerar é se o seu problema pode ser resolvido através de um algoritmo de classificação. O algoritmo de classificação tem o objetivo de encontrar uma classe na variável resposta. Para descobrir um valor numérico, você deve recorrer à algoritmos de regressão.
Por último, o que deve ter ocasionado um erro no código, foi o fato de você ter escolhido duas colunas como variável resposta. Você pode ter apenas uma variável resposta no seu algoritmo. Ele não é capaz de prever duas variáveis de uma só vez. Portanto, na linha y = dataset [["M_Gols_Casa","M_Gols_Vis"]]
, você terá que fazer uma escolha de qual variável quer utilizar como variável dependente.
Se tiver alguma dúvida, estou à disposição para ajudar.
Bons estudos!