1
resposta

Duvida sobre os grupos

Eu revi o vídeo algumas vezes, mas eu não entendi o motivo da gente criar uma coluna para o modelo do carro e de como ela, a nova coluna, pode ajudar a melhorar o nosso modelo.

1 resposta

Olá Samuel, tudo bem? Espero que sim!

Desculpe pela demora em retornar.

O modelo inicial utilizava o preço, a kilometragem, e a idade do carro para determinar se o carro foi vendido ou não. Portanto são 3 informações utilizadas para a explicação de uma variável resposta. Mas será que essas são as únicas características necessárias para determinar se um carro é vendido ou não?

Conforme você aumenta a quantidade de variáveis explicativas a um modelo, maior o poder de explicação de uma variável resposta. Claro que devemos avaliar se as variáveis que estão sendo adicionadas fazem sentido e são significantes para a explicação de uma variável. O tipo de modelo de um carro parece ser algo que faça sentido ser adicionado para explicar se um carro foi vendido ou não. Dessa forma você terá mais poder de explicação da variável resposta.

O instrutor utilizou uma abordagem para definir o modelo de carro com base na idade do veículo, fazendo uma certa variação aleatória. Mas você pode utilizar o resultado de um algoritmo de clusterização nos seus dados para encontrar os modelos de cada um desses veículos, e dessa forma poderia obter resultados ainda melhores.

Ao aumentar muito a quantidade de variáveis, o poder de explicação irá aumentar mas cada vez mais com uma velocidade mais lenta, visto que as variáveis explicativas podem estar explicando umas as outras, ainda que de forma indireta. Portanto, há um certo limite no qual devemos ponderar ao aumentar a quantidade de variáveis, que não trarão grandes melhorias de resultados e que podem ainda trazer problemas como o de multicolinearidade e de utilização computacional muito grande.

Espero que tenha tirado sua dúvida.

Estou à disposição. Bons estudos!