1
resposta

[Projeto] 08 Desafio: identificando fraudes

import pandas as pd

def identifica_outliers(df, coluna):
# 1. Calculando os quartis e o IQR
q1 = df[coluna].quantile(0.25)
q3 = df[coluna].quantile(0.75)
iqr = q3 - q1

# 2. Definindo os limites
limite_inferior = q1 - 1.5 * iqr
limite_superior = q3 + 1.5 * iqr

# 3. Filtrando os outliers
outliers = df[(df[coluna] < limite_inferior) | (df[coluna] > limite_superior)]

return outliers

Aplicando a função no seu DataFrame

possiveis_fraudes = identifica_outliers(df, 'Valor da transação')

print(f"Foram detectadas {len(possiveis_fraudes)} transações suspeitas:")
display(possiveis_fraudes)

1 resposta

Oi, Moacir! Como vai?

Agradeço por compartilhar seu código com a comunidade Alura.

Você estruturou bem a função de identificação de outliers usando o método do IQR, com etapas claras e bem organizadas. A separação entre cálculo dos quartis, definição dos limites e filtragem torna o código fácil de entender e reutilizar, o que é um ponto importante em análises com pandas.

Uma dica interessante para o futuro é utilizar o método describe() para ter uma visão geral rápida da distribuição dos dados antes de aplicar regras de outliers:


resumo = df['Valor_da_transacao'].describe()
print(resumo)

Esse código mostra estatísticas como media, quartis e valores extremos, ajudando a entender melhor o comportamento dos dados antes da filtragem.

Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!

Para saber mais:
Alura Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!