2
respostas

Diferença nos dados

Estou acompanhando o código do professor mas os meus outputs estão diferentes.

Não sei em qual parte do código gerou essa diferença mas não acredito que seja no loop for porque eu printei antes, executei o loop, printei depois e os dados eram os mesmos.

Notebook aluno

Notebook professor

Obs.: Inclusive eu usei o for com dados para simular o problema citado no início do vídeo.

2 respostas

Olá Pedro, tudo bem? Espero que sim!

Somente com o código que foi apresentado não consigo identificar o que pode ter dado errado. Confira se a base de dados é a mesma usada pelo instrutor, com o nome aluguel_residencial na pasta dados. O código para se chegar ao resultado que o instrutor apresentou e o seguinte:

import pandas as pd

dados = pd.read_csv('dados/aluguel_residencial.csv', sep = ';')

bairros = ['Barra da Tijuca', 'Copacabana', 'Ipanema', 'Leblon', 'Botafogo', 'Flamengo', 'Tijuca']
selecao = dados['Bairro'].isin(bairros)
dados = dados[selecao]
dados['Bairro'].drop_duplicates()
grupo_bairro = dados.groupby('Bairro')

Após isso, utilizando os códigos abaixo você encontrará os outputs idênticos aos da aula:

for bairro, data in grupo_bairro:
    print('{} -> {}'.format(bairro, data.Valor.mean()))

Output:

Barra da Tijuca -> 7069.552938130986

Botafogo -> 8791.828178694159

Copacabana -> 4126.677004538578

Flamengo -> 4113.526610644258

Ipanema -> 9352.001133786847

Leblon -> 8746.344992050874

Tijuca -> 2043.52

grupo_bairro[['Valor', 'Condominio']].mean().round(2)

Output:

BairroValorCondominio
Barra da Tijuca7069.553591.01
Botafogo8791.83976.28
Copacabana4126.681148.68
Flamengo4113.531102.15
Ipanema93522244.44
Leblon8746.342107.18
Tijuca2043.52711.69

Na Atividade 01 da aula 09 você consegue baixar o projeto da aula 08 e checar os códigos e os dados.

Espero que tenha ajudado.

Estou à disposição. Bons estudos!

Eu usei a base errada, tinha usado a de aluguel e não aluguel_residencial. Obrigado, João!