A extração dos dados é realizada de forma automatizada e contínua, por meio de uma rotina programada que se conecta à fonte de dados em tempo real. Essa rotina aplica filtros específicos, como palavras-chave ou termos relevantes, e coleta as informações assim que são publicadas.
O fluxo de extração é executado periodicamente ou de forma contínua, garantindo que os dados sejam capturados assim que disponíveis. As informações extraídas são estruturadas em formato padrão e armazenadas para serem processadas nas próximas etapas do pipeline.