1
resposta

[Dúvida] É recomendável usar IAs especializadas para transcrição de áudios e vídeos?

Minha dúvida é se ChatGPT, Gemini e outras IAs generativas farão esse trabalho de transcrição com a mesma eficiência que ferramentas como o Transkriptor, que eu tenho usado na modalidade paga.

1 resposta

Olá Marcos,

QUando pensamos no número de modelos fine-tunados diferentes que existem hoje fica até difícil dizer qual é melhor para cada caso e se alguma IA genérica é melhor que outra.

Quando falamos de tarefas específicas (como essa que você citou de transcrição), em geral uma empresa que tem um modelo especializado (termo utilizado para dizer que um modelo foi treinado ou ajustado em um tarefa em determinado contexto), costuma ter desempenho melhor para tal tarefa pq ela de fato tem uma base de dados que utilizou para treinar modelos e acaba fazendo uso disso para ter modelo melhor e na prática quando você for comparar, dependendo do nível de complexidade da sua tarefa vai notar que os modelos genéricos sem especialização como GPT, Gemini, e cloud não tem o resultado refinado como outros que são especializado nisso.

Contudo, o que ocorre muitas vezes é que algumas empresas fazem um wrapper (significa que apenas pegam um foundation model sem ajuste adequado) e servem isso para público.

Nesse segundo caso você irá notar que de fato os resultados são bem parecidos.

Logo, minha sugestão é sempre testar e verificar se o modelo atende bem suas demandas.