1
resposta

Quebrando a cabeça aqui. Consegui os números, mas o print está embaralhado.

  1. Organizando o print. Não sei como separar o groupby, formatando a linha. Eu gostaria de ver as médias organizadas assim: Media Geral Média Masculino Média Feminino

  2. No dataset, eu gostaria de trocar 0 por M e 1 por F. A mesma coisa para as UFs, que estão com números. Por exemplo, a UF 11 é SP. Como fazer?

  3. Essa prática, de trocar o conteúdo do dataset, para deixá-lo mais "mneumônico", ou fácil de entender, é uma boa prática? Ou tem alguma desvantagem que desconheço?

  4. Os outliers atrapalham demais a análise. Como estamos fazendo exercício, apenas, eu quero excluir os outliers de renda. Como fazer? Usa-se drop, para os valores máximos?

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

1 resposta

Respondendo a 2 pergunta: Se você perceber o comando 'dados.groupy('Sexo').Renda.mean().round(2)' retorna uma series. Você pode guardar ela em uma variável e depois utilizar o comando 'rename()' para renomear os índices da series. Ficaria:

series = dados.groupy('Sexo').Renda.mean().round(2)
series.rename({0: 'M', 1: 'F'})