Separei uma amostra de 1.000 filmes de um catálogo de aprox. 30.000 e extraí a quantidade de palavras presentes na descrição de cada um dos 1.000 filmes.
Desta quantidade de palavras tirei a média de palavras por filme. Gostaria de generalizar esta média "para todos os filmes, mesmo os que não estão na amostra", ou seja, gostaria de saber o "Intervalo de confiança da média".
Para isso utilizei o "Z Test" e obtive um intervalo de valores para esta média generalizada.
Porém fiz o teste de normalidade com os dados e percebi que a distribição de palavras por filme não segue uma distribuição normal.
Minha dúvida é: mesmo assim (minha amostra não seguindo a distribuição normal) ainda posso utilizar o Z Test para obter um intervalo de confiança ?