eu só não entendi por que o dado[0] foi considerado como sendo o diâmetro. No código original no github deu a entender que o índice 0 seriam os nomes (laranjas e toranjas)
eu só não entendi por que o dado[0] foi considerado como sendo o diâmetro. No código original no github deu a entender que o índice 0 seriam os nomes (laranjas e toranjas)
Oi, Gabriel! Como vai?
Realmente, no arquivo raw do Github, podemos ver que a primeira coluna é o nome da fruta.
Porém, lembremos uma característica fundamental do Numpy: sempre trabalhamos com dados de um único tipo dentro de um array. Por isso, ao ler o arquivo, utilizamos dentro da função readtxt
o parâmetro usecols
com um valor que seleciona as colunas da base de dados a partir da primeira.
dados = np.loadtxt(url, delimiter=',',skiprows=1,dtype=float, usecols=np.arange(1,6,1))
A função np.arange(1,6,1)
gera o array [1, 2, 3, 4, 5]
, então, a coluna de índice 0 é desconsiderada.
Executando dados
para visualizar o array, temos a seguinte saída:
array([[ 2.96, 86.76, 172. , 85. , 2. ],
[ 3.91, 88.05, 166. , 78. , 3. ],
[ 4.42, 95.17, 156. , 81. , 2. ],
...,
[ 15.59, 256.5 , 168. , 82. , 20. ],
[ 15.92, 260.14, 142. , 72. , 11. ],
[ 16.45, 261.51, 152. , 74. , 2. ]])
Perceba que todos os valores são apenas numéricos.
Espero que tenha ficado mais claro, Gabriel.
Abraços.