A didática utilizada pela professora é bem simples e bem prática, o que nos leva a associar melhor o conteúdo ao resultado que esperamos entregar ao ser contratado por alguma empresa. Confesso que essa nova versão clareou bastante tudo que vinha estudando, mas não consegui.
import pandas as pd
Nome Idade Notas Aprovado
0 Ary 20 7.5 True
1 Ana 18 NaN False
2 Cátia 27 2.5 False
3 Denis 18 5.0 False
4 Beto 21 10.0 True
5 Bruna 23 NaN False
6 Dara 21 7.0 True
7 Carlos 19 6.0 True
8 Alice 35 5.6 False
9 Vitor 28 NaN False
10 Daniel 21 NaN False
11 Igor 24 4.5 False
12 Sthefanie 26 9.5 True
13 Mirla 25 9.0 True
14 Paulo 37 NaN False
15 Mylena 29 7.0 True
16 Lucas 33 NaN False
17 Nadia 34 8.0 True
dados = pd.read_csv(url, sep=',')
dados.head(7)
Nome Idade Notas Aprovado
0 Ary 20 7.5 True
1 Ana 18 NaN False
2 Cátia 27 2.5 False
3 Denis 18 5.0 False
4 Beto 21 10.0 True
5 Bruna 23 NaN False
6 Dara 21 7.0 True
dados.tail(5)
Nome Idade Notas Aprovado
13 Mirla 25 9.0 True
14 Paulo 37 NaN False
15 Mylena 29 7.0 True
16 Lucas 33 NaN False
17 Nadia 34 8.0 True
type(dados)
pandas.core.frame.DataFrame
dados.shape
(18, 4)
dados.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 18 entries, 0 to 17
Data columns (total 4 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 Nome 18 non-null object
1 Idade 18 non-null int64
2 Notas 12 non-null float64
3 Aprovado 18 non-null bool
dtypes: bool(1), float64(1), int64(1), object(1)
memory usage: 578.0+ bytes
dados['Nome']
0 Ary
1 Ana
2 Cátia
3 Denis
4 Beto
5 Bruna
6 Dara
7 Carlos
8 Alice
9 Vitor
10 Daniel
11 Igor
12 Sthefanie
13 Mirla
14 Paulo
15 Mylena
16 Lucas
17 Nadia
Name: Nome, dtype: object
dados[['Idade', 'Notas']]
Idade Notas
0 20 7.5
1 18 NaN
2 27 2.5
3 18 5.0
4 21 10.0
5 23 NaN
6 21 7.0
7 19 6.0
8 35 5.6
9 28 NaN
10 21 NaN
11 24 4.5
12 26 9.5
13 25 9.0
14 37 NaN
15 29 7.0
16 33 NaN
17 34 8.0
dados.dtypes
Nome object
Idade int64
Notas float64
Aprovado bool
dtype: object
dados.describe()
Idade Notas
count 18.000000 12.000000
mean 25.500000 6.800000
std 6.070662 2.204953
min 18.000000 2.500000
25% 21.000000 5.450000
50% 24.500000 7.000000
75% 28.750000 8.250000
max 37.000000 10.000000
Gostaria de saber se esse último código, .describe(), mostrou o resultado de acordo, o solicitado no código?