1
resposta

Formatação de colunas com numpy

Ola pessoal

Estou transpondo os exemplos do curso para outro modelo de regressão múltipla

Tenho uma tabela com 500 registros e 19 colunas

Os input são as 18 primeiras colunas, e o output esperado é a coluna final

Com o código abaixo não consegui obter resultado, pois o reshape está errado, e não sei onde

posts = pd.read_csv("dataset_test.csv")

posts_info = posts[posts.columns[1:18]]
posts_like = posts[posts.columns[18]]

treino, teste, treino_marcacoes, teste_marcacoes =  train_test_split(posts_info, posts_like)

treino = np.array(treino).reshape(len(treino), 18)
teste = np.array(teste).reshape(len(teste), 1)

modelo = LinearRegression().fit(treino, treino_marcacoes)

Segue aqui o stack trace

Traceback (most recent call last):
  File "*.py", line 26, in <module>
    treino = np.array(treino).reshape(len(treino), 18)
ValueError: cannot reshape array of size 6375 into shape (375,18)

De acordo com ele eu não consigo realocar 6375 em uma tabela com as dimensões 375 por 18

Alguém conseguiu reproduzir o exemplo em outro ambiente?

1 resposta

Fala ai Henrique, de boa?

Vi que sua dúvida tá aberta faz um tempinho, conseguiu resolver ? Se sim, fala para gente como fez isso ?

Eu fiz uma busca para ver se era algo comum e acabei caindo no stackoverflow, rs.

Dá uma olhadinha que bizarro: https://stackoverflow.com/questions/42947298/valueerror-cannot-reshape-array-of-size-30470400-into-shape-50-1104-104