Estou tentando assistir e ler essa aula novamente. Poderiam me ajudar com alguns pontos?
1º. O que são dados de treino e para que temos eles? 2º. O que são dados de teste e porque temos eles? 3º. Para que serve o train_test_split? 4º. Por que devemos passar o test_size de 0.30 e não de 0.40 ou 0.50? O que é esse test_size ? Mede o quê? 5º. A função extraiu os valores de Tempo_treino, Tempo_teste, nPassageiros_treino e nPassageiros_teste. Para quê extraímos esses valores? O que eles significam? 6º. O que é esse regressor? Para que ele serve? regressor = linear_model.LinearRegression() 7º. Em um determinado ponto o professor faz o fit(), o que é isso e para que ele faz? 8º. Em outro momento o instrutor, quando quer retornar os valores para o formato de dataframe para poder plotar o gráfico, ele utiliza o flatten(), mas não lembro em nenhum curso anterior os instrutores utilizarem essa função para tornar ios arrays do numpy um gráfico. Poderia explicar para quê exatamente serve o flatten()? 9º. Tem outro curso melhor com o qual posso começar a aprender machine learning? Comecei por esse devido a fazer parte da formação de python em data science, mas foi uma má escolha e está me desanimando sobremaneira nos estudos.
Obrigado.