Solucionado (ver solução)
Solucionado
(ver solução)
7
respostas

Indexação no Sitemap.xml

Assisti o curso de SEO no Wordpress, utilizando o plugin Yoast o professor disse e recomendou para não indexarmos sub-páginas (paginação), categorias, tags e página de autor. Por que estão em constante mudança e contém posts e conteúdos duplicados, a minha pergunta é: quando configuramos o sitemap.xml também devemos configurar para não indexar essas taxonomias, pois o mesmo não citou em vídeo, desde já obrigado o aprendizado é excelente!

Abs

7 respostas

Fala ai Matheus, essa configuração para "não indexar" deve ser feita no robots.txt, não se era essa sua dúvida.

Espero ter ajudado

Matheus, eu entendi que essa é uma configuração do robots.txt, mas a pergunta é o quanto isso influencia no sitemap.xml, se eu remover também do sitemap.xml as páginas de categorias e as outras citadas acima, seria uma má ou boa prática?

Oi, Matheus (Santos).

Segundo o próprio Google, "um sitemap é um arquivo no qual é possível listar as páginas do seu site para informar o Google e os outros mecanismos de pesquisa sobre a organização do conteúdo do site." (Fonte: https://support.google.com/webmasters/answer/156184?hl=pt-BR)

Ou seja, se você não quiser que os buscadores indexem certas páginas do seu site, não faz sentido elas estarem no seu sitemap.xml.

Lembre-se apenas que o fato de uma página não estar presente no sitemap.xml não significa que ela não será indexada. Para impedir que certas páginas sejam indexadas, é preciso configurar o robots.txt ― como o Matheus (Castiglioni) falou ― ou usar o noindex.

Abraços

Olá Matheus,

Como os colegas Thiago Xavier e Matheus Castiglioni explicaram muito bem, a questão está toda no arquivo robots.txt

solução!

Então Matheus, assim como o Thiago mencionou, no sitemap podemos "ajudar" o google a estrutura e entender a navegação e as páginas contidos em nosso site.

Um site sem o sitemap também vai ser indexado e escaneado pelos spiders do google, porém, é ele que vai ter de varrer nossa site página por página, e entender a navegação entre elas.

Com o sitemap isso seria teoricamente mais fácil, então se você tem páginas que pretende não indexar, não tem porque elas estarem no arquivo e devem estar no robots, porque mesmo não estando no sitemap o google ainda irá indexar elas, apenas se não estiverem no robots.

Agora eu entendi, obrigado pela ajuda pessoal.

De nada, sempre que precisar não deixe de criar suas dúvidas.

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software