2
respostas

[Projeto] Projeto Whisper AI

O Whisper é um modelo de reconhecimento automático de fala (ASR) criado pela OpenAI.
Ele consegue transcrever áudios com alta precisão, suporta múltiplos idiomas, lida bem com ruído e sotaques, e pode ser usado localmente, de forma gratuita.
[blog.gok.digital]

COMO TRANSCRIBIR ÁUDIO EM TEXTO COM O WHISPER {seta}
A seguir estão dois caminhos:

Usar o Whisper localmente (gratuito)
Usar a API da OpenAI (pago, mas simples e moderno)

  1. Transcrição Local (100% grátis) {ok}
    Baseado no Guia Completo de Instalação e Uso do Whisper.
    [cursos.alura.com.br]

Pré-requisitos {ferramentas}
Você precisa ter instalado:

Python 3.7 a 3.11
Git
FFmpeg (essencial)
(Opcional: GPU NVIDIA + CUDA)
[pt.wikipedia.org]

Instalação {download}
No terminal:
Shellpip install git+https://github.com/openai/whisper.gitMostrar mais linhas
[pt.wikipedia.org]
Instale também o FFmpeg, necessário para leitura de arquivos de áudio.
[pt.wikipedia.org]

Transcrevendo um arquivo {microfone}
Após instalar, basta rodar:
Shellwhisper meu_audio.mp3 --model smallMostrar mais linhas
Isso gera:

Um arquivo .txt com o texto
Arquivos .srt ou .vtt se quiser legendas
[hub.asimov.academy]

Sobre os modelos {lupa}

tiny – muito rápido, porém menos preciso
base
small – bom equilíbrio
medium
large – mais preciso, mais lento
[digitei.com]

  1. Transcrição via API da OpenAI (Whisper-1 ou GPT‑4o‑transcribe) {foguete}
    O que você precisa {livro}

Conta na OpenAI
Chave de API
[blog.gok.digital]

Exemplo em Python {computador}
Pythonfrom openai import OpenAIclient = OpenAI()audio_file = open("audio.mp3", "rb")transcription = client.audio.transcriptions.create( model="whisper-1", file=audio_file)print(transcription.text)Mostrar mais linhas
[blog.gok.digital]

Whisper-1 vs GPT‑4o‑transcribe {lampada}

whisper-1 → estável, preciso, ótimo custo-benefício
gpt‑4o‑transcribe → mais moderno, mais preciso, melhor para áudios longos
[blog.gok.digital]

Como gravar bons áudios para transcrição {gravacao}
Dicas:

Use um microfone decente
Grave em ambiente silencioso
Evite eco
[pt.wikipedia.org]

Resumo Rápido {anotar}

Nota: Por restrição de segurança não é possivel anexar o arquivo

2 respostas

Olá, Andreia! Como vai?

Você mandou muito bem na forma como estruturou o conteúdo sobre o Whisper e apresentou os dois caminhos de uso!

Sua resposta mostra uma explicação clara dos pré-requisitos técnicos, um passo a passo objetivo para instalação e transcrição local, além de destacar as diferenças entre os modelos e a alternativa via API. Também é notável como você incluiu dicas práticas de gravação de áudio e organizou o material em seções bem sinalizadas, o que facilita a compreensão e aplicação.

Uma sugestão para o futuro seria acrescentar exemplos de casos de uso reais (como transcrição de entrevistas, podcasts ou reuniões), para tornar o tutorial ainda mais contextualizado e atrativo para diferentes perfis de usuários.

Fico à disposição! E se precisar, conte sempre com o apoio do fórum.

Abraço e bons estudos!

AluraConte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!

É possível transcrever videoaulas do portal da minha faculdade por essa ferramenta? Pelo endereço web no caso