Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

O código da aula 'Feature engineering e Encoding' não foi postado

Além da aula 'colunas em dicionarios', na aula 'Feature engineering e Encoding', o professor afirma disponibilizar um código de feature engineering do curso passado, que imagino ser o ' Data Analytics: Machine Learning no Marketing Digital' . Tenho visto o curso passado e não achei o código, além de não achar nesse curso. Podem disponibilizar?

1 resposta
solução!

Olá Lucas, obrigado pela observação. Vamos adicionar o código em uma atividade, mas segue aqui caso ainda precise.

# Criando lista com variaveis quantitativas
quant = list(set(totals) - set(coluna_na) - set(['transactionRevenue','transactions']))

#Criando dataframe com os resultadas quantitativos das sessoes
visitas_totals = visitas.groupby('fullVisitorId',as_index=False)[quant].sum()

# Última visita
visitas_ultima = visitas.groupby('fullVisitorId',as_index=False)
visitas_ultima = visitas_ultima['visitNumber'].max()

# Combinação entre visitantes e visitas únicos
usuarios_visitas_unicos = visitas.drop_duplicates(subset=['fullVisitorId','visitNumber'])

# Dataframe usuários com todos os usuários unicos e sua última visita
usuarios = pd.merge(visitas_ultima,usuarios_visitas_unicos,left_on=['fullVisitorId','visitNumber'],
                    right_on=['fullVisitorId','visitNumber'],how='left')

# Primeira visita
visitas_primeira = visitas.groupby('fullVisitorId',as_index=False)['visitNumber'].min()
visitas_primeira.set_index('fullVisitorId',inplace=True)

# Dataframe usuários com todos os usuários unicos + sua última visita + primeira visita
usuarios = usuarios.join(visitas_primeira,how='left',on='fullVisitorId',rsuffix='_primeira')
usuarios = pd.merge(usuarios,usuarios_visitas_unicos,left_on=['fullVisitorId','visitNumber_primeira'],
                    right_on=['fullVisitorId','visitNumber'],how='left',suffixes=('_ultima','_primeira'))

# Dataframe usuários com todos os usuários unicos + sua última visita + primeira visita + somatório das colunas quant
usuarios = pd.merge(usuarios,visitas_totals,left_on=['fullVisitorId'],
                    right_on=['fullVisitorId'],how='left')

# Removendo totais
for i in quant:
    usuarios.drop(i+'_primeira',axis=1,inplace=True)
    usuarios.drop(i+'_ultima',axis=1,inplace=True)

# Calculando o tempo entre primeira e última visista
usuarios['tempo_visitas'] = usuarios.visitStartTime_ultima - usuarios.visitStartTime_primeira