1
resposta

Problemas com sns para plotar e comparar amostras de treino e de teste

Olá pessoal

Na aula 03 de intro ao SKLearn, não estou conseguindo plotar no sns.scatterplot a amostra de teste com o hue sendo uma outro array

sns.scatterplot(x="horas_esperadas", y="preco", hue=teste_y, data=teste_x) 

Aparece a seguinte mensagem de erro:

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-54-589b6cc2cae3> in <module>()
----> 1 sns.scatterplot(x='expected_hours', y='price', hue=test_y_web, data=test_x_web)

11 frames
/usr/local/lib/python3.6/dist-packages/pandas/core/internals/managers.py in _stack_arrays(tuples, dtype)
   1874     stacked = np.empty(shape, dtype=dtype)
   1875     for i, arr in enumerate(arrays):
-> 1876         stacked[i] = _asarray_compat(arr)
   1877 
   1878     return stacked, placement

ValueError: could not broadcast input array from shape (540) into shape (1)

PS: test_y_web é um array 540x1

Alguém pode me ajudar? Obrigado!!!

1 resposta

Olá,

Deve ter algum problema no momento que você cria o test_y_web, talvez nem todos os elementos desse array tenha a mesma dimensão ou algo do tipo. Pode compartilhar o trecho que você cria esse array.

PS: fiz os testes com o teste_y e funciona perfeitamente, tentei simular o erro mas não consegui! PS 2: Se a saída de teste_y_web.shape for (540,1) também vai dar erro, mas nesse caso da um erro de dimensionalidade. A saída deve ser (540, )

Att.