Solucionado (ver solução)
Solucionado
(ver solução)
4
respostas

the number of iterations - Há algo de errado?

O número de iterações não parece ser o suficiente para chegar ao resultado correto.

Se isto estiver correto então o resultado informado no vídeo está incorreto. Já que 1000 iterações são um valor baixíssimo para a quantidade de dados testado.

Aumentei esse número (e acho que o fiz corretamente) e reduzi para 2.5% o tamanho da amostra. Uma hora de cálculo tanto no google colab quanto na minha modesta máquina e ainda não há resultado conclusivo.

O código é o mesmo da aula.

Pontos alterados:

treino_x, teste_x, treino_y, teste_y = train_test_split(x, y, random_state = SEED, test_size = 0.025, stratify = y)

modelo = LinearSVC(max_iter=1000000000)

4 respostas

O silêncio sobre o assunto continua.

Olá Bruno tudo bem com você??

Abri uma solicitação para verificar seu questionamento junto aos instrutores. Agradeço muito sua dúvida e atividade aqui no fórum! =)

Assim que eu obtiver um retorno, daremos sequência nesse tópico que está sendo acompanhando.

Obrigado

Victor Gonzalez

Oi Bruno, de fato, o número de iterações e o tamanho do dataset são variáveis que precisam de testes e mais testes. O questionamento que fica é: se aumentarmos consideravelmente o número de interações para uma classificação ou treinamento, também não estamos adicionando uma margem de viés particular na solução?

Acredito que esta seja uma daquelas situações: treinei com tantas iterações com um certo dataset, foi inconclusivo, aumentei, melhorou, tem viés? Qual é o número ideal? Não tem uma resposta correta.

Outra questão que pode ficar aberta está ligada a nossa própria expectativa: se o resultado não foi o que a gente esperava, vamos ficar ajustando até que o resultado bata nossa expectativa ou vamos investigar por que o resultado foi aquele?

São todas questões que não tem resposta fácil e exata. Vai da experiência e do caso estudado. Faz sentido?

solução!

Dificilmente os dados não terão viés. O mesmo vale para as informações geradas desses dados e das interpretações das informações geradas dos dados.

Mas, agradeço pela atenção. Estou pesquisando e lendo livro sobre o assunto para complementar.

Abraço!