Se o Google está rastreando páginas 404, significa que o algoritmo gosta do seu site. Ele verifica repetidamente as páginas para ver se o conteúdo está indisponível mesmo, o que indica que ele vê algum valor ali.
Parece contraditório, mas John Mueller, porta-voz da big tech, explicou que o acesso repetido às páginas com status 404 é um bom sinal.
Há mais de 10 anos, a big tech vem explicando que ter páginas 404 não é um problema. Ainda assim, o status causa preocupação.
Entenda a seguir por que você não precisa se preocupar tanto com esse suposto erro.
O status 404 confunde muita gente
O status HTTP 404 (não encontrado) indica que um conteúdo não existe ou não está disponível. Ele aparece quando um navegador ou rastreador tenta acessar uma URL sem sucesso.
Isso acontece quando um conteúdo foi removido ou quando a página que nunca existiu (por exemplo, quando você digita o site errado no navegador).
Frequentemente o Google encontra essas páginas no sitemap, ou rastreando outras páginas da web. Aí aparece no relatório de indexação do Search Console, com a mensagem Não encontrado (404).
É aqui que começa a confusão: muita gente pensa que todas as mensagens do GSC são erros. Mas não é assim, boa parte delas são apenas status, inclusive o 404. Aparece ali para você saber o que está acontecendo, ver as URLs e decidir se quer tomar alguma ação.
O próprio Google espera encontrar 404 enquanto rastreia sites.
Código de resposta 404 e 410
A confusão fica ainda maior quando consideramos outros status HTTP da categoria 4xx. O 410 é o mais comum e indica que um conteúdo foi removido permanentemente.
O Google rastreia páginas 404 para ver se o conteúdo está realmente indisponível. Quando se depara com o conteúdo inexistente, ele pode voltar à página para ver se já voltou.
Esse comportamento indica que o Google vê valor naquela URL e, de certa forma, no que o site posta em geral. Ou seja, se o GSC está mostrando páginas 404, você não precisa se desesperar, nem impedir o Googlebot de acessá-las.
“Elas não causam problemas, então eu só deixaria assim. As páginas serão rerastreadas provavelmente por um bom tempo, um código 410 não mudaria isso. De certa forma, significa que o Google acharia ok rastrear mais conteúdo do seu site”.
Ele estava respondendo a um usuário que reclamou do Google rastrear páginas 404 antigas, que não estão no sitemap dele. A preocupação era estar gastando crawl budget desnecessariamente. John explicou que não é o caso.
404 não é um erro de SEO do seu site
Você não precisa eliminar o 404 do seu site. O código indica que houve um erro na requisição para acessar a URL, não que o SEO do seu site está ruim, ou que a página precisa de algum tipo de manutenção.
Inclusive, essa percepção pode dar origem a um erro de verdade: o soft 404. Ele acontece quando uma página deveria retornar status 404, mas mostra 200 (OK).
Quando isso acontece, o Google recebe sinais conflitantes e pode indexar uma página que não agrega valor aos visitantes. Além de prejudicar a experiência dos visitantes, também pode limitar a sua visibilidade nos mecanismos de busca.
Quando corrigir erros 404
Segundo Gary Illyes, engenheiro do Google, você precisa se preocupar com o 404 apenas em duas situações:
A URL 404 deveria retornar conteúdo. Acontece por exemplo quando você faz um link interno errado (www.site.com/text em vez de www.site.com/texto);
A URL 404 pode ser útil aos visitantes. Nesse caso, redirecione para outro conteúdo útil, relacionado ao que está na URL 404. Se redirecionar para uma página genérica, como a home do site, pode gerar soft 404.
Nos demais casos, você não precisa fazer nada.
Nada disso é novidade
As informações de John Mueller são novas, mas toda a discussão sobre as páginas 404 é bem antiga.
Em 2014, o Google já havia explicado que o 404 não é algo super preocupante para a saúde de sites. Na época, Matts Cutts, então porta-voz da Pesquisa Orgânica, explicou que:
“Acontece que os webmasters acabam prejudicando a si mesmos com bastante frequência. […] No caso dos erros 404… A gente meio que espera e pensa: bem, talvez tenha sido um erro 404 passageiro. Talvez não fosse realmente a intenção que a página não fosse encontrada. E, assim, no sistema de rastreamento, ela ficará protegida por 24 horas.
… Agora, não interpretem isso da maneira errada: ainda vamos voltar, verificar novamente e ter certeza se essas páginas realmente sumiram ou se talvez tenham voltado a funcionar…
Projetamos nosso sistema de rastreamento para tentar ser robusto. Mas se o seu site ficar fora do ar, ou se você for hackeado ou algo assim, tentamos garantir que ainda possamos encontrar o conteúdo válido sempre que ele estiver disponível”.
___
Para descobrir o que realmente é erro e merece a sua atenção, tenha o apoio de especialistas em SEO. Otimizar um site é uma tarefa complexa, impossível de fazer apenas se guiando por auditorias de ferramentas de SEO, ou relatórios do GSC.
Elyson Gums é redator na SEO Happy Hour. Trabalha com redação e produção de conteúdo para projetos de SEO e inbound marketing desde 2014, em segmentos B2C e B2B. É bacharel em Jornalismo (Univali/SC) e mestre em Comunicação Social (UFPR).
Comentários