Gostaria de compreender porque é feita a divisão por 1.000.000 no cálulo de custo de uso dos modelos Gemini.
Gostaria de compreender porque é feita a divisão por 1.000.000 no cálulo de custo de uso dos modelos Gemini.
Olá, Luana, como vai?
A divisão por 1.000.000 no cálculo ocorre porque a precificação dos modelos da API do Gemini, assim como de diversas outras LLMs, é estabelecida com base em um milhão de tokens. Quando consultamos as tabelas de preços oficiais, os valores de entrada e saída são apresentados como frações de dólar por cada 1.000.000 de tokens processados. Portanto, ao multiplicar a quantidade de tokens consumidos pelo preço unitário da tabela, o resultado reflete o custo de um milhão de unidades, exigindo a divisão para encontrar o valor real de uma execução individual.
Imagine que o custo de entrada do modelo Flash seja de 0,30 dólares por 1 milhão de tokens. Se uma pergunta possui 1.000 tokens, o cálculo seria realizado da seguinte forma:
1000 * 0,30 / 1000000
Nesse cenário, o valor resultante seria 0,0003 dólares. Sem a divisão, o sistema retornaria um custo de 300 dólares para uma única consulta, o que não corresponderia à realidade tarifária do serviço.
Espero ter ajudado.
Siga firme nos seus estudos e conte com o fórum sempre que precisar.
Abraços :)
Obrigada!