Oi Pedro. Obrigado por ter me respondido.
Então, eu já havia colocado o tips_atualizado.csv para analisar e me surpreendi com alguns resultados (em dois testes de hipótese o p-value ficou abaixo do 0,05 e a hipótese nula foi rejeitada, algo que não havia acontecido com o arquivo tips.csv, com menos entradas).
No entanto, os testes foram em relação à distribuição do valor da conta, e não com relação à gorjeta. O único teste de hipótese diferente foi o da sobremesa, em que era verificado se a distribuição da taxa de gorjeta era igual entre os que pediram ou não pediram sobremesa (no caso do tips_atualizado, a hipótese nula, de que as distribuições eram iguais, foi rejeitada).
Por conta disso, a dúvida permaneceu se algum fator influenciou o valor da gorjeta.
O que eu consegui analisar foi que entre os que não pediram sobremesa havia uma curva crescente mais acentuada no gráfico gorjeta x valor da conta. Também acredito que a taxa de gorjeta se manteve numa certa constância quando comparada ao valor da conta (com uma leve queda conforme o valor da conta aumentava), mas que não foi influenciada por nenhum fator analisado.
Essa parte de análise me dá muita dificuldade de entender. Não sei o que analisar e qual conclusão tirar... :(