Ao realizar a rotina dessa aula não estou criando um viés no meu data frame?
Ao realizar a rotina dessa aula não estou criando um viés no meu data frame?
Olá Pedro, tudo bem? Espero que sim!
O dataframe criado por essa rotina terá uma quantidade igual de dados para cada tipo de OVNI e somente pegará dados de tipos de OVNI que são mais frequentes, podendo escolher um valor de frequência que será analisado.
O modelo será capaz de prever somente os tipos que estarão no dataframe criado. Os tipos de OVNI menos frequentes não poderão ser identificados ao utilizar essa rotina mas por outro lado, com essa abordagem, a taxa de acerto dos OVNIs mais frequentes será maior em comparação a um modelo que tenta prever todos os tipos ao mesmo tempo.
Essa abordagem depende do seu objetivo, se o objetivo for acertar mais os tipos mais frequentes, o que é melhor do que não acertar quase nenhum tipo ou acertar de forma aleatória, pode ser uma bom método.
Estou à disposição. Bons estudos!