Ei! Tudo bem, William?
A diferença no resultado pode estar na forma como o índice Gini do grupo foi calculado.
No cálculo do Gini de um nó, não usamos p(1-p) para cada classe separadamente e depois somamos. O cálculo precisa considerar primeiro o quadrado das proporções das classes e depois faz a subtração.
Para o grupo Sim (4 transações):
Fraude = 2/4 = 0,5
Não fraude = 2/4 = 0,5
Gini do nó = 1 - (0,5² + 0,5²)
Gini do nó = 1 - (0,25 + 0,25)
Gini do nó = 0,5
Até aqui você chegou no mesmo valor.
Depois aplicamos o peso do nó, que é 4/5:
Gini ponderado = 0,5 * 4/5
Gini ponderado = 0,4
Para o grupo Não (1 transação):
Fraude = 1/1
Não fraude = 0/1
Gini do nó = 1 - (1² + 0²)
Gini do nó = 0
Peso = 1/5
Gini ponderado = 0
Somando os dois:
Gini total = 0,4
A diferença para o 0,3, na explicação da aula, os valores utilizados para calcular o Gini foram apresentados de forma resumida. O objetivo é comparar os atributos e escolher o menor Gini para definir o primeiro nó da árvore.
Ou seja, seu cálculo está consistente com a lógica do índice Gini. A diferença vem apenas da simplificação usada na explicação do vídeo para focar no processo de construção da árvore.
Espero ter ajudado. COntinue praticando e se dedicando aos estudos e qualquer coisa compartilhe no fórum.
Bons estudos e até mais!
Caso este post tenha lhe ajudado, por favor, marcar como solucionado