Testei varias vezes alterando o vlaor dele no codigo mas vi que sempre retornava o mesmo valor e nao entendi sua ultilidade
train_x, test_x, train_y, test_y= train_test_split(x,y,random_state=0,test_size=0.25,stratify = y)
Testei varias vezes alterando o vlaor dele no codigo mas vi que sempre retornava o mesmo valor e nao entendi sua ultilidade
train_x, test_x, train_y, test_y= train_test_split(x,y,random_state=0,test_size=0.25,stratify = y)
o shuffle é usado para embaralhar suas matrizes aleatoriamente. Programaticamente, seqüências aleatórias são geradas usando um número de semente. Você tem a garantia de ter a mesma seqüência aleatória, se você usar a mesma semente. o random_state parâmetro permite que você forneça esta semente aleatória para aprender os métodos. Isso é útil porque permite que você reproduza a aleatoriedade para seus propósitos de desenvolvimento e teste. Então, no shuffle método, se eu usar o mesmo random_state com o mesmo conjunto de dados, eu sempre tenho a garantia de ter o mesmo shuffle. Considere o seguinte exemplo:
X = np.array([[1., 0.], [2., 1.], [0., 0.]]) X = shuffle(X, random_state=20) Se isso me der a seguinte saída,
array([[ 0., 0.], [ 2., 1.], [ 1., 0.]]) Agora, eu estou sempre garantido que se eu usar o random_state = 20Eu sempre vou conseguir exatamente o mesmo embaralhamento. Isto é particularmente útil para testes de unidade, onde você gostaria de ter resultados reproduzíveis para afirmar suas condições sendo testadas.
Espero que ajude!