1
resposta

[Projeto] Desafio - identificando fraudes

#criando a função para identificar outliers através do método de intervalo interquartil

def identifica_outlier_interquartil(coluna, df):

  #obter o 1º e o 3º quartil da coluna do df
  q1 = df[coluna].quantile(0.25)
  q3 = df[coluna].quantile(.75)

  #obter intervalo interquartil
  IQR = q3 - q1

  #obter limites superior e inferior
  limite_inferior = q1 - 1.5 * IQR
  limite_superior = q1 + 1.5 * IQR

  #print(f'1º Quartil: {q1} , 3º Quartil: {q3}, IQR (Intervalo inter quartil): {IQR}')
  #print(f'Limite inferior: {limite_inferior}, Limite superior: {limite_superior}')

  #obter os dados que estão abaixo do limite inferior ou acima do limite superior
  outliers_registros = (df[coluna] < limite_inferior) | (df[coluna] > limite_superior)
  
  print(f'Estes são os registros com outliers identificados na coluna {coluna}:')
  print(df[outliers_registros])
  
#executando a função com a df fornecida na aula
identifica_outlier_interquartil('Valor da transação', df)
1 resposta

Olá, Vinicius! Como vai?

Parabéns pela resolução da atividade!

Observei que você explorou o uso de funções para organizar o seu código Python, utilizou muito bem o cálculo do intervalo interquartil para identificar outliers e ainda compreendeu a importância de aplicar limites superior e inferior para destacar registros fora do padrão.

Continue postando as suas soluções, com certeza isso ajudará outros estudantes e tem grande relevância para o fórum.

Sugestão de conteúdo para você mergulhar ainda mais no tema:

Alguns materiais estão em inglês, mas é possível compreendê-los usando o recurso de tradução de páginas do próprio navegador.

Fico à disposição! E se precisar, conte sempre com o apoio do fórum.

Abraço e bons estudos!

AluraConte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!