2
respostas

t_student.ppf

Prezados, boa tarde.

Por gentileza, fiquei com uma dúvida em relação a utilização da significância com utilização da tabela t_student.

No exemplo:

Um famoso fabricante de refrigerantes alega que uma lata de 350 ml de seu principal produto contém, no máximo, 37 gramas de açúcar. Esta alegação nos leva a entender que a quantidade média de açúcar em uma lata de refrigerante deve ser igual ou menor que 37 g.

Um consumidor desconfiado e com conhecimentos em inferência estatística resolve testar a alegação do fabricante e seleciona, aleatóriamente, em um conjunto de estabelecimentos distintos, uma amostra de 25 latas do refrigerante em questão. Utilizando o equipamento correto o consumidor obteve as quantidades de açúcar em todas as 25 latas de sua amostra.

Assumindo que essa população se distribua aproximadamente como uma normal e considerando um nível de significância de 5%, é possível aceitar como válida a alegação do fabricante?

Para achar o t_alpha no teste unicaudal superior, o professor utiliza a confiança como parâmetro da função:

t_alpha = t_student.ppf(confianca, graus_de_liberdade)

Já no exemplo:

Em nosso dataset temos os rendimento dos chefes de domicílio obtidos da Pesquisa Nacional por Amostra de Domicílios - PNAD no ano de 2015. Um problema bastante conhecido em nosso país diz respeito a desigualdade de renda, principalmente entre homens e mulheres.

Duas amostras aleatórias, uma de 6 homens e outra com 8 mulheres, foram selecionadas em nosso dataset. Com o objetivo de comprovar tal desigualdade teste a igualdade das médias entra estas duas amostras com um nível de significância de 5%.

Para achar o t_alpha no teste de mann-whitney, o professor utiliza a significância como parâmetro da função:

t_alpha = t_student.ppf(significancia, graus_de_liberdade).

Não consegui entender a diferenção da utilização dos parâmetros, por gentileza, vocês podem me ajudar com uma explicação.

2 respostas

boa noite,

por gentileza, vcs conseguiram verificar a minha dúvida?

Boas Rafael! Tudo bem? Espero que sim!

Vou começar com algumas considerações sobre os dois testes - student e o mann-whitney, e depois revisar a aplicação em código, vamos lá?


O Teste T de Student

O Teste T de Student trabalha com a hipótese de que a média seja igual a um certo valor, normalmente 0 (H0: μ = 0).

No nosso caso, isso pode ser traduzido para:

A média salarial de homens é igual à de mulheres?

Além disso, o Student t test necessita que as duas comparações sejam realizadas no mesmo contexto, que ambas as considerações tenham a mesma variância.

Há também uma necessidade de ter uma certa quantidade de amostras para que o teste possa ser realizado sem o risco de que outliers modifiquem o resultado da estatística.

O Teste Mann-Whitney

Já o Teste de Menn-Whitney é um um teste não paramétrico indicado quando:

  • A quantidade amostral é muito pequena;
  • Não consegue ter a certeza de que as amostras derivam de uma disribuição T ou normal;
  • Não se pode dizer se ambas as amostras são da mesma distribuição;
  • Quando se tem amostras de tamanho diferente.

A hipótese nula nesse caso é que que ambas amostras foram retiradas de populações com médias iguais.

No caso do exemplo, isso pode ser traduzido por:

A partir de alguns casos, podemos verificar que a média salarial de todos os homens e de todas as mulheres são iguais?


Vamos ao código

No código, como o teste é uni-caudal inferior, usamos o nível de significância para já extrair o valor da parte que nos interessa (a parte negativa da cauda).

Caso fosse passado o nível de confiança, o resultado seria o mesmo, mas para a porção superior.

Espero ter ajudado. Deixo abaixo alguns links que me ajudaram a encontrar essa resposta:

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software