1
resposta

Regex - acentuação de palavras

Olá pessoal.

Estou fazendo um mecanismo de busca de palavras em documentos HTML e estou usando regex.

Ao procurar por "grafico" (sem acentuação), é possível encontrar a palavra "gráfico" (com acentuação) usando regex?

Se sim, alguém consegue me dar uma direção?

Obrigado.

André.

1 resposta

Olá André, tudo bem?

Creio que não tenha nenhum caractere coringa em que você possa equalizar "a" com "á", por exemplo. Embora para nós, humanos, parece ser o mesmo caractere "só" mudando o acento, para o computador trata-se de dois caracteres completamente diferentes cada um tendo a sua própria sequência de bits de acordo com o charset empregado.

Creio que o mais fácil seria você, antes de aplicar a sua expressão regular, "traduzir" os caracteres acentuados realizando um grande "de-para" em cada um (á -> a, é -> e etc.).

http://semplicewebsites.com/removing-accents-javascript

Assim, a palavra "gráfico" se tornaria "grafico".

Abraços!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software