1
resposta

[Dúvida] Cruzamento das variáveis

Bom dia;

Sei que: dados.Cor.value_counts().unique() irá retornar o array "array([35925, 31815, 8391, 357, 352])"

e que dados.Sexo.value_counts().unique() retorna o array "array([53250, 23590])"

Agora, não entendi o cruzamento de variáveis e parece não ter sido explicado no vídeo.

Como é feito esse cruzamento?

1 resposta

Oi, Herbert, tudo bem?

Desculpe a demora em te responder!

O cruzamento de variáveis é uma técnica utilizada para analisar a relação entre duas variáveis em um conjunto de dados. No caso dessa aula são analisadas as relações entre as variáveis "Sexo" e "Cor" por meio do método .crosstab() do Pandas.

A função pd.crosstab() recebe a variável "Sexo" como argumento para as linhas e a variável "Cor" como argumento para as colunas. O resultado é uma tabela que mostra a frequência de ocorrência de cada combinação de valores das duas variáveis. Por exemplo, no caso do cruzamento entre "Sexo" e "Cor", a tabela resultante mostrará a quantidade de pessoas de cada sexo (masculino e feminino) para cada cor (indígena, branca, preta, amarela, parda).

Caso queira mais informações sobre o método .crosstabdo Pandas, você pode ler a documentação abaixo:

Espero ter ajudado. Caso tenha dúvidas, não hesite em postar no fórum.

Abraços!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!