Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

[Dúvida] Cálculo de custo de uso do modelo

Gostaria de compreender porque é feita a divisão por 1.000.000 no cálulo de custo de uso dos modelos Gemini.

2 respostas
solução!

Olá, Luana, como vai?

A divisão por 1.000.000 no cálculo ocorre porque a precificação dos modelos da API do Gemini, assim como de diversas outras LLMs, é estabelecida com base em um milhão de tokens. Quando consultamos as tabelas de preços oficiais, os valores de entrada e saída são apresentados como frações de dólar por cada 1.000.000 de tokens processados. Portanto, ao multiplicar a quantidade de tokens consumidos pelo preço unitário da tabela, o resultado reflete o custo de um milhão de unidades, exigindo a divisão para encontrar o valor real de uma execução individual.

Imagine que o custo de entrada do modelo Flash seja de 0,30 dólares por 1 milhão de tokens. Se uma pergunta possui 1.000 tokens, o cálculo seria realizado da seguinte forma:

1000 * 0,30 / 1000000

Nesse cenário, o valor resultante seria 0,0003 dólares. Sem a divisão, o sistema retornaria um custo de 300 dólares para uma única consulta, o que não corresponderia à realidade tarifária do serviço.

Espero ter ajudado.

Siga firme nos seus estudos e conte com o fórum sempre que precisar.

Abraços :)

Caso este post tenha lhe ajudado, por favor, marcar como solucionado

Obrigada!