Relatório de Análise IV
Seleção e Frequências
#Importaremos o Pandas e o novo conjunto de dados aluguel_residencial.csv. Precisamos inserir o separador ;, como de costume.
import pandas as pd
dados = pd.read_csv('/content/drive/MyDrive/CURSO ALURA/PROJETOS PYHTON/CURSO PANDAS/DADOS/aluguel.csv',sep =';')
#Visualizaremos as primeiras dez linhas do nosso banco de dados:
dados.head(10)
Para organizarmos melhor nossas tarefas dentro do arquivo, copiaremos o conteúdo do e-mail enviado para a empresa, e inseriremos o caractere #, para comentar todos os tópicos. Para fazer isso de maneira mais rápida, basta selecionar todo o conteúdo e pressionar o atalho "Ctrl + /"
#Selecione somente os imóveis classificados com tipo 'Apartamento'.
#Criaremos uma variável selecao e atribuiremos a ela a Series booleana, como fizemos nas aulas anteriores.
selecao = dados['Tipo'] == "Apartamento"
selecao
#Teremos como resultado marcações False ou True nos dados analisados.
0 False
1 False
2 False
3 True
4 True
...
32955 False
32956 True
32957 True
32958 True
32959 False
Name: Tipo, Length: 32960, dtype: bool
#Queremos coletar a frequência dessa seleção no banco de dados. Criaremos uma variável n1, que armazenará a Series do DataFrame,
#e selecionar apenas os resultados verdadeiros [0]Linhas [1] Colunas.
selecao = dados['Tipo']== 'Apartamento'
n1 = dados[selecao].shape[0]
print('Total de Apartamentos:',n1)
Total de Apartamentos: 19532
#Selecione os imóveis classificados com tipos 'Casa', 'Casa de Condomínio' e 'Casa de Vila'.
#Seguiremos para o próximo tópico, em que realizaremos a seleção de 'Casa', 'Casa de Condomínio' e 'Casa de Vila'.
#Neste caso, deveremos utilizar o operador |, que traz a ideia de "ou", isto é, ou 'Casa' ou 'Casa de Condomínio'.
selecao = (dados['Tipo'] == 'Casa') | (dados['Tipo'] == 'Casa de Vila') | (dados['Tipo'] == 'Casa de Condomínio')
n2 = dados[selecao].shape[0]
print('Total de Casas, Casas de Vila e Casa de Condomínio:',n2)
Total de Casas, Casas de Vila e Casa de Condomínio: 2212
#Selecione os imóveis com área entre 60 e 100 metros quadrados, incluindo os limites.
#Desta vez, trabalharemos com a variável Area , e como teremos dois temos neste código, então devemos usar () para separá-los.
#Um dos termos deve ser maior ou igual(>=) a 60, enquanto o outro deve ser mais ou igual a 100.
selecao = (dados['Area'] >= 60) & (dados['Area'] <=100)
n3 = dados[selecao].shape[0]
print('Posuuímos um todal de,',n3,'imóveis com áreas entre 60 e 100 metros')
output
Posuuímos um todal de, 10187 imóveis com áreas entre 60 e 100 metros
#Selecione os imóveis que tenham pelo menos 4 quartos e aluguel menor que R$ 2.000,00.
#Trabalharemos com duas variáveis diferentes neste caso: Quartos e Valor,
#em seguida estipularemos uma quantidade específica para cada variável,
#de forma que sejam selecionados apenas os elementos que preenchem os requisitos.
selecao = (dados['Quartos'] >= 4) & (dados['Valor'] < 2000)
n4 = dados[selecao].shape[0]
print('Possuímos um total de,',n4,'Imóveis com pelo menos 4 quartos e o seu Aluguel menor que R$ 2.000,00')
output
Possuímos um total de, 43 Imóveis com pelo menos 4 quartos e o seu Aluguel menor que R$ 2.000,00
print("Nº de imóveis classificados com o tipo 'Apartamento' -> {}".format(n1))
print("Nº de imóveis classificados com tipos 'Casa', 'Casa de Condomínio' e 'Casa de Vila'-> {}".format(n2))
print("Nº de imóveis com área entre 60 e 100 metros quadrados, incluindo os limites -> {}".format(n3))
print("Nº de imóveis que tenham pelo menos 4 quartos e aluguel menor que R$ 2.000,00 -> {}".format(n4))
import pandas as pd
alunos = pd.DataFrame({'Nome':['Alex','Lucieny','Patricia','Edinho','Lucas','Thiago','Alice'],
'Sexo': ['M','F','F','M','M','M','F'],
'Idade':[48,50,45,37,19,12,1],
'Notas':[10,9,8,10,8,9,10],
'Aprovado':[True, True,True,False,True,False,True]},
columns = ['Nome','Idade','Sexo','Notas','Aprovado'])
alunos
# Crie um DataFrame somente com os alunos aprovados.
selecao = alunos['Aprovado'] == True
aprovados = alunos[selecao]
aprovados
# Crie um DataFrame somente com as alunas aprovadas.
selecao = (alunos['Sexo'] == 'F') & (alunos['Aprovado'] == True)
alunasaprovadas = alunos[selecao]
alunasaprovadas
output
# Crie apenas uma visualização dos alunos com idade entre 10 e 20 anos ou com idade maior ou igual a 40 anos.
selecao1 = (alunos['Idade'] > 10) & ( alunos['Idade'] < 20) | (alunos['Idade'] >= 40)
n1 = (alunos[selecao1])
n1
output