Olá! Estou tentando rodar localmente alguns notebooks de RAG (no VSCode e Colab), usando outras LLMs no lugar do Gemini por causa da quota. Porém, sempre que executo funções como:
def executar_rag_e_coletar_dados(perguntas):
try:
...
except:
...
o código cai no except com erro de timeout, mesmo trocando o modelo.
Alguém sabe:
quais LLMs/ bibliotecas posso usar como alternativa ao Gemini para esse tipo de notebook?
se existe alguma forma de aumentar o tempo de timeout ou tratar isso melhor?
se o erro pode ser configuração de token, rede ou versão das libs?
Estou tentando praticar RAG com outros temas para aprender, então qualquer dica ajuda. Obrigado!