Olá,
Fiquei com uma dúvida sobre a aula de seleção de features. Aos 8:28 da aula é criado um dataframe chamado "feature_importances" classificando as features mais importantes para posterior seleção em treinamento de um novo modelo.
Porém, o resultado da função de classificação sort_values foi usado apenas para exibição do dataframe classificado, mas, não foi salvo.
Veja que as features mais importantes são:
'airline_BZ', 'is_holiday', 'aircraft_type_Airbus A320', 'aircraft_type_Airbus A330', 'aircraft_type_Embraer E175', 'arrival_time', 'aircraft_type_Boeing 787', 'origin_TCY', ...
Ao realizar o teste [1, 5, 10, 15, 20, 25, 30] as features parecem não estar em ordem de importância.
Veja que a relação de features utilizadas para criar o dataframe "X_selected_features" é diferente da relação acima (11:14 da aula)
Inclusive schengen é a menos importante de todas e aparece como uma feature selecionada.
Eu tive dificuldade de realizar a tarefa mão na massa da aula 04-07, porque o meu modelo foi treinado considerando a classificação de importância e ficou diferente da aula, quando fui criar dados da nova amostra, as colunas divergiam.