Minha grade duvida,
Tenho algumas tabelas que estão separadas em várias arquivos alguns exemplo
- Pessoa Fisicas
- RGs
- Telefones
- Emails
e somente a de pessoa fisica por exemplo tem 20gb e em média 227 milhões de linha e em outras tabelas como RG tem menos e emails e telefones tem mais, a chave de ligação sempre é o campo CPF_HASH, o problema que vejo é que um elasticsearch é muito caro para rodar isto fora que é uma ferramenta paga. Estou usando o mongoDB como pipeline mas usar ele como produção para disponibilizar a cliente ele se torna mais caro até que o elasticsearch pelo fato de precisar utilizar ele em cluster que necessita de diversos servidores se não me engano precisa de um config-server e um outro já de saida.
Mas queria ver quais seriam melhores formas de trabalhar com isso ?
Por exemplo na hora de cruzar esses dados eu gero uma tabela resultante onde cada registro/documento vai ter tudo sobre aquele CPF.