Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Falta de aprofundamento no curso

O instrutor nos mostra pela primeira vez vários tipos de parâmetros para a geração dos gráficos, e não deixa um link de documentação para consulta, não se aprofunda na explicação de nenhum novo parâmetro.. Decepcionado com essa parte 2 da formação de Python para Data Science. Ele mostra sim que tem bastante conhecimento sobre o assunto, mas isso não significa que ele saiba passar de uma forma didática e simples pra quem está tendo o primeiro contato nessa área.

Especificamente minha dúvida nessa aula é sobre os parâmetros hue e col

O que ficou entendido para mim, é que com o parâmetro hue mantemos 2 cores distintas no gráfico plotado E com o parâmetro col mantemos os dados separados em 2 gráficos, um ao lado do outro É isso?

1 resposta
solução!

Olá rafael, boa tarde!

Vamos lá! o parâmetro hue é uma forma segmentar as cores na hora de plotar seu gráfico. Por exemplo:

No dataset iris.csv temos 3 espécies de flores diferentes, caso quisessemos plotar o comprimento da sépala pela largura sépala, utilizariamos o código abaixo:

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

iris = sns.load_dataset("iris")

sns.relplot(x="sepal_length", y="sepal_width", data=iris, kind="scatter")

Mas como saber qual ponto é de cada espécie? É aí que entra o parâmetro hue, que vai marcar cada uma das espécies; ou seja, o parâmetro hue segmenta seu gráfico a partir de uma coluna selecionada, onde cada valor será um grupo.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

iris = sns.load_dataset("iris")

sns.relplot(x="sepal_length", y="sepal_width", hue="species", data=iris, kind="scatter")

Já o parâmetro col é utilizado para separar essas segmentações em colunas e pode ser utilizado com o mesmo nome de coluna que vc definiu para o hue, e ele separará o gráfico no número de grupos que houver para que seja possível visualizar separadamente:

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

iris = sns.load_dataset("iris")

sns.relplot(x="sepal_length", y="sepal_width", hue="species", data=iris, kind="scatter", col="species")

Recomendo testar os 3 códigos e ver as suas diferenças.

Nenhum curso irá conseguir explorar tudo que existe nas bibliotecas, são muitas coisas! Mas todas as bibliotecas possuem sua própria documentação, a seaborn fica nesse link: https://seaborn.pydata.org/

Espero ter ajudado, qualquer dúvida só perguntar :)