0
respostas

ao inserir dados em uma amostra, para balancear a variável alvo, não altero as probabilidades a priori das classes dessa amostra?

Se o uso do Naive Bayes implica em usar as probabilidades "a priori", fiquei com a impressão que elas são obtidas pela contagem das ocorrências nos dados originais (amostra original).

Agora, se o "X_treino" e "y_treino", que passamos para treinar o modelo (bnb.fit(X_treino, y_treino)), receberam os dados a mais, para balancear a variável target (neste caso Churn): (smt = SMOTE(random_state=123) # Instancia um objeto da classe SMOTE X, y = smt.fit_resample(X, y) # Realiza a reamostragem do conjunto de dados)

... então o resultado do modelo não fica alterado ao que seria usando apenas os dados reais da amostra original?

Ou seja, ao inserir dados em uma amostra, para balancear a variável alvo, não altero as probabilidades a priori das classes dessa amostra?