1
resposta

[Dúvida] Diferença do Sample e head

Qual a Diferença do .sample() .head() ?

1 resposta

Olá, Pablo, tudo belezinha?

Apesar de visualmente serem muitos parecidos, são dois métodos diferentes. O sample() nos retorna uma linha ou mais de forma aleatória no nosso conjunto de dados, já o head(), nos retorna os primeiros dados do nosso conjunto, então para ficar mais visual vamos pegar por exemplo um conjunto de dados:

import pandas as pd
dados = pd.DataFrame({'coluna1': [2, 4, 8, 0],
                   'coluna2': [2, 0, 0, 0],
                   'coluna3': [10, 2, 1, 8]})
dados

Saida: | | coluna1 | coluna2 | coluna3 | |---:|----------:|----------:|----------:| | 0 | 2 | 2 | 10 | | 1 | 4 | 0 | 2 | | 2 | 8 | 0 | 1 | | 3 | 0 | 0 | 8 |

Se utilizarmos o head() vamos ter como retorno as primeiras linhas do nosso conjunto de dados, desta forma:


dados.head(2)

Saída: | | coluna1 | coluna2 | coluna3 | |---:|----------:|----------:|----------:| | 0 | 2 | 2 | 10 | | 1 | 4 | 0 | 2 |

Mas usando o sample() iremos ter um retorno aleatório das linhas como saída.


dados.sample(2)

Saída:

coluna1coluna2coluna3
2801
02210

OBS: Como o retorno do sample() é aleatório, a cada vez que rodar terá um resultado diferente.

Se ainda tiver alguma dúvida, estou por aqui. Ótimos estudos e um forte abraço!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!