Oi, Claudio! Como vai?
O erro indica um problema na execução do seu job no Vertex AI, especificamente na tarefa exit-handler-1, o que pode estar relacionado a:
- Recursos insuficientes: Verifique se alocou memória, CPU e máquinas virtuais adequadas para o treinamento. Talvez seja necessário ajustar a memória RAM, o número de CPUs virtuais ou o tipo de máquina virtual usada.
- Problemas com os dados: Revise seu conjunto de dados, garantindo que ele não tenha erros ou inconsistências.
- Configurações: Confirme se os parâmetros, como região, modelo e saída, estão corretos.
- Permissões: Assegure-se de que sua conta possui permissões para executar o job.
Tente criar um job de treinamento com um conjunto de dados muito pequeno (apenas algumas linhas). Se funcionar, o problema pode estar no conjunto de dados original. Se falhar, revise as configurações e permissões.
Espero ter ajudado. Conte com o apoio do Fórum na sua jornada. Fico à disposição.
Abraços e bons estudos!
Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!