Prezados, boa tarde.
Por gentileza, fiquei com uma dúvida em relação a utilização da significância com utilização da tabela t_student.
No exemplo:
Um famoso fabricante de refrigerantes alega que uma lata de 350 ml de seu principal produto contém, no máximo, 37 gramas de açúcar. Esta alegação nos leva a entender que a quantidade média de açúcar em uma lata de refrigerante deve ser igual ou menor que 37 g.
Um consumidor desconfiado e com conhecimentos em inferência estatística resolve testar a alegação do fabricante e seleciona, aleatóriamente, em um conjunto de estabelecimentos distintos, uma amostra de 25 latas do refrigerante em questão. Utilizando o equipamento correto o consumidor obteve as quantidades de açúcar em todas as 25 latas de sua amostra.
Assumindo que essa população se distribua aproximadamente como uma normal e considerando um nível de significância de 5%, é possível aceitar como válida a alegação do fabricante?
Para achar o t_alpha no teste unicaudal superior, o professor utiliza a confiança como parâmetro da função:
t_alpha = t_student.ppf(confianca, graus_de_liberdade)
Já no exemplo:
Em nosso dataset temos os rendimento dos chefes de domicílio obtidos da Pesquisa Nacional por Amostra de Domicílios - PNAD no ano de 2015. Um problema bastante conhecido em nosso país diz respeito a desigualdade de renda, principalmente entre homens e mulheres.
Duas amostras aleatórias, uma de 6 homens e outra com 8 mulheres, foram selecionadas em nosso dataset. Com o objetivo de comprovar tal desigualdade teste a igualdade das médias entra estas duas amostras com um nível de significância de 5%.
Para achar o t_alpha no teste de mann-whitney, o professor utiliza a significância como parâmetro da função:
t_alpha = t_student.ppf(significancia, graus_de_liberdade).
Não consegui entender a diferenção da utilização dos parâmetros, por gentileza, vocês podem me ajudar com uma explicação.