Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

Analise descritiva

Olá bom dia

gostaria de ajuda,

O objetivo do meu trabalho será estimar um modelo de Machine Learning utilizando a técnica de Regressão Linear para demonstrar os impactos das variáveis disponibilizadas neste sobre o valor total de vendas em reais (Y). No final do projeto apresentar um modelo de previsão para o faturamento médio em reais segundo os inputs de um conjunto de variáveis 10 (X's).

estou com uma base com 53 observações e 11 variaveis, sendo 10 unidades de produto (X's) e uma em valor R$ (Y)

ao fazer analise descritiva

dados.describe().round(2)

o Python não apresenta a variavel valor

obrigada

2 respostas
solução!

Olá Carolina, tudo bem? Espero que sim!

Verifique se a coluna de valor está em formato numérico. Provavelmente essa coluna não foi identificada como um formato numérico no momento da importação dos dados.

Para checar, basta fazer:

dados.info()

Serão descritas todas as colunas de seu conjunto de dados. As colunas que apresentarem o tipo object estão sendo identificadas como texto e não números. Isso pode estar acontecendo se estiver algum valor em branco, com um caractere em conjunto com o número como R$, se o número estiver separado por vírgula ( , ) e não por ponto final ( . ).

Portanto, precisa ser realizado um tratamento da coluna para transformá-la em formato numérico. Para realizar essa conversão, basta utilizar a função pd.to_numeric(dados['valor']), onde 'valor' é substituído pelo nome da coluna de valores.

Vou deixar aqui as documentações da função de conversão to_numeric e DataFrame.astype.

Se ainda tiver alguma dúvida estou à disposição.

Bons estudos!

resolvido, obrigada