Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

Erro em célula do notebook

Finalizei o curso sem problemas, mas estava reorganizando o notebook e tive problema com uma célula! Por via das dúvidas, baixei o projeto final e o problema também ocorreu. Por favor, podem ajudar a esclarecer?

Célula:

from sklearn.linear_model import LogisticRegression

regressao_logistica = LogisticRegression()
regressao_logistica.fit(treino, classe_treino)
acuracia = regressao_logistica.score(teste, classe_teste)
print(acuracia)

Erro:

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-13-564044a41945> in <module>
      1 # Modelo
      2 regressao_logistica = LogisticRegression()
----> 3 regressao_logistica.fit(treino, classe_treino)
      4 acuracia = regressao_logistica.score(teste, classe_teste)
      5 print(acuracia)

~\anaconda3\lib\site-packages\sklearn\linear_model\_logistic.py in fit(self, X, y, sample_weight)
   1340             _dtype = [np.float64, np.float32]
   1341 
-> 1342         X, y = self._validate_data(X, y, accept_sparse='csr', dtype=_dtype,
   1343                                    order="C",
   1344                                    accept_large_sparse=solver != 'liblinear')

~\anaconda3\lib\site-packages\sklearn\base.py in _validate_data(self, X, y, reset, validate_separately, **check_params)
    430                 y = check_array(y, **check_y_params)
    431             else:
--> 432                 X, y = check_X_y(X, y, **check_params)
    433             out = X, y
    434 

~\anaconda3\lib\site-packages\sklearn\utils\validation.py in inner_f(*args, **kwargs)
     71                           FutureWarning)
     72         kwargs.update({k: arg for k, arg in zip(sig.parameters, args)})
---> 73         return f(**kwargs)
     74     return inner_f
     75 

~\anaconda3\lib\site-packages\sklearn\utils\validation.py in check_X_y(X, y, accept_sparse, accept_large_sparse, dtype, order, copy, force_all_finite, ensure_2d, allow_nd, multi_output, ensure_min_samples, ensure_min_features, y_numeric, estimator)
    794         raise ValueError("y cannot be None")
    795 
--> 796     X = check_array(X, accept_sparse=accept_sparse,
    797                     accept_large_sparse=accept_large_sparse,
    798                     dtype=dtype, order=order, copy=copy,

~\anaconda3\lib\site-packages\sklearn\utils\validation.py in inner_f(*args, **kwargs)
     71                           FutureWarning)
     72         kwargs.update({k: arg for k, arg in zip(sig.parameters, args)})
---> 73         return f(**kwargs)
     74     return inner_f
     75 

~\anaconda3\lib\site-packages\sklearn\utils\validation.py in check_array(array, accept_sparse, accept_large_sparse, dtype, order, copy, force_all_finite, ensure_2d, allow_nd, ensure_min_samples, ensure_min_features, estimator)
    597                     array = array.astype(dtype, casting="unsafe", copy=False)
    598                 else:
--> 599                     array = np.asarray(array, order=order, dtype=dtype)
    600             except ComplexWarning:
    601                 raise ValueError("Complex data not supported\n"

~\anaconda3\lib\site-packages\numpy\core\_asarray.py in asarray(a, dtype, order)
     83 
     84     """
---> 85     return array(a, dtype, copy=False, order=order)
     86 
     87 

~\anaconda3\lib\site-packages\pandas\core\series.py in __array__(self, dtype)
    752               dtype='datetime64[ns]')
    753         """
--> 754         return np.asarray(self.array, dtype)
    755 
    756     # ----------------------------------------------------------------------

~\anaconda3\lib\site-packages\numpy\core\_asarray.py in asarray(a, dtype, order)
     83 
     84     """
---> 85     return array(a, dtype, copy=False, order=order)
     86 
     87 

~\anaconda3\lib\site-packages\pandas\core\arrays\numpy_.py in __array__(self, dtype)
    182 
    183     def __array__(self, dtype=None) -> np.ndarray:
--> 184         return np.asarray(self._ndarray, dtype=dtype)
    185 
    186     _HANDLED_TYPES = (np.ndarray, numbers.Number)

~\anaconda3\lib\site-packages\numpy\core\_asarray.py in asarray(a, dtype, order)
     83 
     84     """
---> 85     return array(a, dtype, copy=False, order=order)
     86 
     87 

ValueError: could not convert string to float: 'Embora o filme tenha sido apenas assim, o closed caption foi de longe o melhor que eu já vi! Na maioria das vezes, a ortografia é terrível e a legenda está fora de sincronia. Eu uso o closed captioning mesmo que eu possa ouvir bem, mas acho que muitos atores resmungam. Também muitas vezes a trilha sonora substitui o diálogo. Obrigado!'
2 respostas
solução!

Olá Wilson, tudo bem ? Espero que sim.

Desculpa pela demora no retorno.

Pela mensagem, entendo que esse código foi feito para dar erro e explicar que não podemos usar o texto diretamente no algoritmo, devemos fazer as transformações que foram ensinadas durante o curso e que vão transformar as palavras em alguma representação numérica.

Isso foi feito logo nas primeiras aulas e deve estar no inicio do notebook certo ?

print do inicio do notebook, para demonstrar onde está localizado o trecho de código discuritodo

Qualquer duvida não hesite em perguntar.

Bons Estudos.

É isto mesmo! Obrigado, Igor.