Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Questão 07 Comparando distribuições

Na questão é tido como verdadeiro a afirmação de que o consumo de certeja no final de semana é mais elevado!

Apesar do boxplot mostrar isso a soma do consumo nos dias de semana são maiores.

#Data frame with beer consumption proportion in the week and weekend
consumption_week = pd.DataFrame({
    'Weekend': [round((data.query('fds == 1')['consumo'].sum() / data['consumo'].sum()) * 100, 2)],
    'Week': [round((data.query('fds == 0')['consumo'].sum() / data['consumo'].sum()) * 100, 2)]},
    index=['%'])

consumption_week

Weekend    Week
%    32.44    67.56

Como explicar essa divergência com o boxplot?

1 resposta
solução!

Oi Marcos, o boxplot e a questão se referiam ao fato da média (e os quartils) do consumo nos finais de semana ser mais elevada do que nos dias de semana, eg:

egg = {'weekend': [4, 4], 'work_day': [2, 2, 2, 2, 2]}

total_consumption = sum(egg['weekend']) + sum(egg['work_day'])

weekend = round(sum(egg['weekend']) / total_consumption, 2)
work_day = round(sum(egg['work_day']) / total_consumption, 2)

print(f'weekend: {weekend}%\nwork_day: {work_day}%')
# Output:
# weekend: 0.44%
# work_day: 0.56%

Como você pode ver, o consumo diário (média) é maior no final de semana, mas ao longo da semana (5 * 2 = 10) se consome mais semana do que no final de semana (4 * 2 = 8) inteiro.

Espero ter ajudado! ^-^