Eu criei um pequeno algoritmo para testar o machine learning na prática criando um cliente hipotético e estimando se ele iria comprar ou não do site:
Eu treinei o algoritmo com o seguinte código:
from sklearn.svm import LinearSVC
import pandas as pd
from sklearn.model_selection import train_test_split
uri = "https://gist.githubusercontent.com/guilhermesilveira/2d2efa37d66b6c84a722ea627a897ced/raw/10968b997d885cbded1c92938c7a9912ba41c615/tracking.csv"
dados = pd.read_csv(uri)
mapa = {
"home" : "pagina_principal",
"how_it_works" : "como_funciona",
"contact" : "contato",
"bought" : "comprou"
}
dados = dados.rename(columns = mapa)
x = dados[["pagina_principal", "como_funciona", "contato"]]
y = dados[["comprou"]]
treino_x, teste_x, treino_y, teste_y = train_test_split(x,y, random_state= 20, test_size=0.25,
stratify=y
)
algoritmo = LinearSVC()
algoritmo.fit(treino_x, treino_y) ## treinou.
depois disso eu criei um novo dataframe com as mesmas colunas da dataframe original só que com dados da navegação de um possível cliente hipotético, meu código ficou assim:
## criando um cliente hipotetico para para verificar se ele irá comprar ou não
cliente_hipotetico = {'pagina_principal': [1],
'como_funciona': [1],
'contato' : [1]
}
cliente_hipotetico = pd.DataFrame (cliente_hipotetico, columns = ['pagina_principal','como_funciona',"contato"])
##verificando se o cliente vai comprar ou não
previsao = algoritmo.predict(cliente_hipotetico)
if(previsao == [0]):
print("O cliente não irá comprar")
else:
print("O cliente irá comprar!")
Esse teste que eu fiz é válido para verificar o que o algoritmo acha quando aparecer um cliente com esses dados? Se não, gostaria de saber um método para verificar a resposta do algoritmo frente a um cliente hipotetico definido.