Qual a Diferença do .sample() .head() ?
Qual a Diferença do .sample() .head() ?
Olá, Pablo, tudo belezinha?
Apesar de visualmente serem muitos parecidos, são dois métodos diferentes. O sample()
nos retorna uma linha ou mais de forma aleatória no nosso conjunto de dados, já o head()
, nos retorna os primeiros dados do nosso conjunto, então para ficar mais visual vamos pegar por exemplo um conjunto de dados:
import pandas as pd
dados = pd.DataFrame({'coluna1': [2, 4, 8, 0],
'coluna2': [2, 0, 0, 0],
'coluna3': [10, 2, 1, 8]})
dados
Saida: | | coluna1 | coluna2 | coluna3 | |---:|----------:|----------:|----------:| | 0 | 2 | 2 | 10 | | 1 | 4 | 0 | 2 | | 2 | 8 | 0 | 1 | | 3 | 0 | 0 | 8 |
Se utilizarmos o head() vamos ter como retorno as primeiras linhas do nosso conjunto de dados, desta forma:
dados.head(2)
Saída: | | coluna1 | coluna2 | coluna3 | |---:|----------:|----------:|----------:| | 0 | 2 | 2 | 10 | | 1 | 4 | 0 | 2 |
Mas usando o sample()
iremos ter um retorno aleatório das linhas como saída.
dados.sample(2)
Saída:
coluna1 | coluna2 | coluna3 | |
---|---|---|---|
2 | 8 | 0 | 1 |
0 | 2 | 2 | 10 |
OBS: Como o retorno do sample()
é aleatório, a cada vez que rodar terá um resultado diferente.
Se ainda tiver alguma dúvida, estou por aqui. Ótimos estudos e um forte abraço!