1
resposta

Por que decidir as cores do gráfico (hue) pelo teste_y?

Oi pessoal, tudo bem?

logo no início da aula o Guilhereme escreve o seguinte código:

sns.scatterplot(x="horas_esperadas", y="preco", hue=teste_y, data=teste_x) 

Mas eu não entendi porque precisamos fazer isso, ou o porquê de querermos isso. E ali na tabela continua separando por finalizados. Será que alguém poderia me explicar?

Grato,

Rennan Cruz.

Imagem da tabela que demonstra que o gráfico ainda é separado por finalizados e não finalizados finalizados

1 resposta

Olá, Rennam! Tudo tranquilo por aí?

O objetivo da utilização do parâmetro hue é para fazer uma separação por cor dos pontos com valores diferentes. Como exemplo da imagem, o que estamos buscando ao fazer essa separação é responder a pergunta "os pontos apresentam alguma característica diferente de acordo com sua label/rótulo?" e conseguimos responder isso através desse gráfico. Os pontos na cor laranja (que são os que apresentam a label 1) apresentam maior preço de acordo com as horas esperadas. Portanto identificamos um padrão nos dados que apresentam label 1 que podem ajudar na explicação dos modelos posteriormente.

Espero ter ajudado, mas caso ainda possua alguma dúvida estou sempre à disposição.

Bons estudos.

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.Bons Estudos!