Indexability (ou indexabilidade) é a capacidade de uma página ser indexada por mecanismos de busca. Quando uma página é indexada, ela se torna parte da base de dados do buscador e está apta a aparecer nos resultados da pesquisa orgânica.
A indexação de uma página funciona assim:
- Você publica uma página no seu site seguindo as boas práticas de SEO;
- O buscador descobre a URL;
- O buscador faz o processo de crawl (escaneia a página para entender o conteúdo e relevância);
- Processa os dados e a indexa (adiciona a um índice);
- Uma vez indexada, a página pode ser exibida nos resultados de busca do Google.
Todos os dias robôs do Google, Bing e outros buscadores varrem a web, fazendo o crawl e a indexação das páginas.
Parte do trabalho de SEO é aumentar a indexabilidade das páginas. Ou seja, tornar o processo de processar as informações o mais simples possível para os buscadores.
Qual é a diferença entre indexability e crawlability?
São dois conceitos complementares, mas diferentes. Indexability e Crawlability são etapas de um mesmo processo de exibir uma página como resultado de pesquisa:
- Crawlability (ou rastreabilidade) é a habilidade de acessar uma página e rastrear o seu conteúdo;
- Indexability (ou indexabilidade) é a habilidade de analisar o conteúdo rastreado e adicioná-lo a um índice —uma base de dados com milhões de páginas prontas para serem exibidas.
O que torna uma página indexável?
O processo é similar para os principais buscadores. Veja abaixo o que é exigido pelo Google:
- Ser rastreável: o Google deve conseguir encontrar, ler e entender a página. O arquivo robots.txt do site indica as diretrizes de quais páginas devem ser rastreadas;
- A página NÃO deve estar marcada como “noindex”: a tag noindex indica que o buscador não deve adicionar a página ao seu índice;
- A página deve ter marcação canônica: se você tem diferentes versões de uma página no seu site, deve indicar uma URL como a principal, por meio da canonical tag. Assim, o Google sabe qual é a principal e ignora possíveis réplicas.
A documentação sobre o funcionamento da pesquisa do Google indica quais são os erros comuns que dificultam o processo:
O que significa uma página não-indexável?
Páginas não-indexáveis não aparecem nos resultados de pesquisa dos mecanismos de busca. São URLs marcadas com a tag noindex, uma instrução para que os buscadores as ignorem.
Este recurso é usado em casos específicos de páginas que devem estar no site, mas adicionam pouco valor do ponto de vista de SEO, como:
- Páginas “internas”, como telas de admin ou login de colaboradores;
- Resultados de busca interna do seu site;
- Páginas de tags de posts de blog.
Como ser indexado pelo Google?
Se você está com problemas de indexabilidade em seu site, ou quer indexar páginas mais rápido, tente o seguinte:
- Envie sitemaps ao Google: o sitemap.xml lista todas as páginas de um site e informa ao buscador quais páginas indexar;
- Organize a arquitetura do seu site: arquitetura de site é a forma como as informações, páginas e elemento de um site se organizam e se relacionam. Um site bem organizado tem melhor rastreabilidade e indexabilidade;
- Use links internos: links internos são hyperlinks para o seu próprio site. O Google consegue entender e “seguir” os links, o que acelera o processo de indexação de novas páginas.
Como saber se uma página está indexada no Google?
O primeiro passo indicado pelo Google em seu guia de SEO é fazer uma pesquisa usando o operador “site:[seusite.com]”. O resultado são todas as páginas indexadas daquele domínio.
Veja dois exemplos:
Além disso, você pode usar a ferramenta de inspeção de URL. É um recurso do Google Search Console que permite várias ações relacionadas à indexação das páginas, como:
- Ver se uma página está indexada ou não;
- Pedir manualmente o rastreamento de uma URL;
- Visualizar como o buscador enxerga a página.
Para consultar uma URL específica do seu site, basta acessar “inspeção de URL” no canto superior esquerdo e digitar o link da página:
Além de conferir se uma URL está indexada, você também pode ver informações sobre o site como um todo dentro do Google Search Console. Por exemplo, é possível ver quais páginas ainda não foram indexadas e por quais razões, enviar sitemaps, ou solicitar remoção de conteúdo da pesquisa orgânica.
As opções estão disponíveis também estão disponíveis no menu à esquerda, agrupadas em “Indexação”:
Para entender os detalhes sobre indexação de páginas no Google, recomendamos a leitura do guia completo sobre o assunto, aqui no blog da SEO Happy Hour.