1
resposta

Código da aula "Feature engineering e Encoding"

Olá pessoal! Eu copiei o código da vídeo-aula e resolvi compartilhar...

# Criando lista com variáveis quantitativas
quant = list(set(totals) - set(coluna_na) - set(['transactionRevenue', 'transactions']))

# Criando dataframe com os resultados quantitativos das sessões
visitas_totals = visitas.groupby('fullVisitorId', as_index=False)[quant].sum()

# Última visita
visitas_ultima = visitas.groupby('fullVisitorId', as_index=False)
visitas_ultima = visitas_ultima['visitNumber'].max()

# Combinação entre visitantes e visitas únicas
usuarios_visitas_unicos = visitas.drop_duplicates(subset=['fullVisitorId', 'visitNumber'])

# DataFrame usuários com todos os usuários únicos e sua última visita
usuarios = pd.merge(visitas_ultima, usuarios_visitas_unicos, left_on=['fullVisitorId', 'visitNumber'], right_on=['fullVisitorId', 'visitNumber'],
                    how='left')

# Primeira visita
visitas_primeira = visitas.groupby('fullVisitorId', as_index=False)['visitNumber'].min()
visitas_primeira.set_index('fullVisitorId', inplace=True)

# DataFrame usuários com todos os usuários únicos + sua última visita + primeira visita
usuarios = usuarios.join(visitas_primeira, how='left', on='fullVisitorId', rsuffix='_primeira')
usuarios = pd.merge(usuarios, usuarios_visitas_unicos, left_on=['fullVisitorId', 'visitNumber_primeira'],
                    right_on=['fullVisitorId', 'visitNumber'], how='left', suffixes=('_ultima', '_primeira'))

# DataFrame usuários com todos os usuários únicos + sua última visita + primeira visita + somatório das colunas quant
usuarios = pd.merge(usuarios, visitas_totals, left_on=['fullVisitorId'], right_on=['fullVisitorId'], how='left')

# Removendo totais
for i in quant:
  usuarios.drop(i+'_primeira', axis=1, inplace=True)
  usuarios.drop(i+'_ultima', axis=1, inplace=True)

# Calculando o tempo entre primeira e última visita
usuarios['tempo_visitas'] = usuarios.visitStartTime_ultima - usuarios.visitStartTime_primeira
# Removendo as colunas Ids
ids = ['fullVisitorId', 'visitId_ultima', 'visitId_primeira']
usuarios.drop(ids, axis=1, inplace=True)

# Criando uma variável y com a coluna resposta
y = usuarios.totalTransactionRevenue.copy()
y.fillna(0, inplace=True)
y[y<0] = 0

# Criando uma variável X com todas as variáveis menos a resposta
X = usuarios.drop('totalTransactionRevenue', axis=1)

# Transformando as variáveis qualitativas em números
from sklearn.preprocessing import LabelEncoder
quali = usuarios.dtypes[usuarios.dtypes == 'object'].keys()
for col in quali:
  lbl = LabelEncoder()
  lbl.fit(list(X[col].values.astype('str')))
  X[col] = lbl.transform(list(X[col].values.astype('str')))
1 resposta

Boa noite Guilherme, como você está?

Antes de mais nada, desculpe pela demora em dar um retorno.

Muito obrigada pela gentiliza e generosidade em disponibilizar o código do curso enquanto não incluíamos na plataforma.

Aproveito para avisar que providenciamos ao final de cada aula o material ou se quiser pode acessar diretamente pelo github digital-marketing-gcp, conforme o passo a passo na sequência.

  1. Entrar na página inicial do repositório que está na atividade Projeto da aula anterior, ou pelo link que passei anteriormente.

  2. Em branches, você consegue acessar o conteúdo específico de cada aula. A branch padrão é a master e nela está conteúdo final do curso. Clicando em branches aparecerá a tabela com título Stale branches, cada linha da tabela corresponde a branch com o conteúdo uma aula específica. Por exemplo, aula 2

Página inicial do repositório, com o menu branches envolto por um retangulo azul, com uma seta apontando para este menu.

Página de branches com destaque para a segunda linha da tabela de título stale branches. O item da linha destacada é aula2 e está envolto por um retangulo azul com uma seta azul apontando para a aula2

  1. Com a brach escolhida, ou a branch padrão, clicar em Code
  2. Em seguida clicar em Clone or Download e baixar como arquivo ZIP

Página principal do repositório com o botão code envolto por um retângulo azul e no canto superior direito há um bola na cor roxa com o número 1 escrito na cor amarela. No menu do botão code, a opção download ZIP está envolta por um retângulo azul e no canto superior direito há um bola na cor roxa com o número 2 escrito na cor amarela

Após isto, basta descompactar a pasta e utilizar o arquivo que deseja.

Espero ter ajudado, mas qualquer coisa é só mandar mensagem aqui viu?!

Abraço e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.Bons Estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software