O Google rastreia apenas os primeiros 2 MB das suas páginas. E isso não é um problema!

Recentemente, o Google anunciou que rastreia apenas os primeiros 2 MB de arquivos HTML e ignora o restante. Logo, arquivos muito grandes são parcialmente invisíveis no buscador. 

A informação causou bastante movimento nas redes sociais. Muita gente ficou preocupada… Mas, na verdade, não é tão sério assim.

Pouquíssimas páginas da web usam arquivos tão grandes. Pra você ter ideia, 2 MB equivale a cerca de 2 milhões de caracteres de texto.

Se as suas páginas são maiores do que isso, você tem problemas muito mais sérios do que o limite de rastreamento do Google. E deveria chamar a SHH pra te ajudar a resolver, inclusive. 😂

Veja como funciona esse anúncio do Google e qual o impacto real dele pro seu site. 

O que o Google mudou no rastreamento?

O Google editou sua documentação para esclarecer os limites de rastreamento do Googlebot. Ao rastrear URLs para a Pesquisa Orgânica, o robô estabelece os seguintes limites:

  • 15 MB para páginas da web;
  • 64 MB para arquivos PDF;
  • 2 MB para os demais arquivos suportados (como o HTML).

O Google explicou o processo da seguinte forma (com tradução e grifos meus):

“Ao rastrear para a Pesquisa Google, o Googlebot rastreia os primeiros 2 MB de um tipo de arquivo compatível e os primeiros 64 MB de um arquivo PDF. Do ponto de vista da renderização, cada recurso referenciado no HTML (como CSS e JavaScript) é buscado separadamente, e cada busca de recurso está sujeita ao mesmo limite de tamanho de arquivo que se aplica a outros arquivos (exceto arquivos PDF).

Quando o limite é atingido, o Googlebot interrompe a busca e envia apenas a parte do arquivo já baixada para consideração de indexação. O limite de tamanho do arquivo é aplicado aos dados descompactados. Outros rastreadores do Google, como o Googlebot Video e o Googlebot Image, podem ter limites diferentes”.

Essa informação causou estranhamento entre os profissionais de SEO.  Afinal, se uma página tem 4 MB, então só metade dela apareceria no Google?

Em teoria é exatamente isso que está escrito. Mas, na prática, raramente as páginas têm esse tamanho, pois cada recurso é rastreado em requisições separadas. 

O HTML raramente passa de 2 MB de tamanho

O arquivo HTML é composto por caracteres de texto que ordenam a página. Por isso, mesmo os arquivos complexos tendem a ser leves. 2 MB é quase 100 vezes mais do que o tamanho médio de uma página da web. 

De acordo com a edição de 2025 do Web Almanac, o peso dos arquivos pode ser entendido assim (em tradução minha):

“Os bytes HTML referem-se ao peso textual puro de todas as marcações na página. Normalmente, incluem a definição do documento e tags comumente usadas na página, como <div> ou <span>. No entanto, também contêm elementos embutidos, como o conteúdo de tags de script ou estilos adicionados a outras tags. Isso pode levar rapidamente ao aumento excessivo do tamanho do documento HTML.”

Apesar dos elementos embutidos, a mediana do tamanho do HTML de sites é de 22 KB, segundo o Web Almanac. Uma página considerada “pesada” tem cerca de 150 KB. Chegar aos 2 MB (ou perto disso) é bem atípico.

O tamanho do HTML é semelhante em computadores e celulares

Boa parte dos sites entrega o mesmo arquivo em desktop e mobile. Logo, não há diferença significativa de tamanho entre os formatos. 

A equipe do Web Almanac explica da seguinte forma: 

“A diferença de tamanho entre dispositivos móveis e computadores é extremamente pequena, o que significa que a maioria dos sites exibe a mesma página para usuários móveis e de computadores. Essa abordagem reduz drasticamente a quantidade de manutenção para os desenvolvedores, mas significa que o peso geral da página provavelmente será maior, pois, na prática, duas versões do site são implantadas em uma única página.”

Mesmo com as duas versões da página sendo implementadas no mesmo arquivo, raramente o tamanho chega ao limite de rastreamento do Google.

Quem precisa se preocupar com as novas limitações do Google?

Somente sites muito grandes (ou mal otimizados) têm arquivos HTML tão grandes. 

Exemplos são páginas com conteúdos dinâmicos massivos, e-commerces que têm muitas variantes de produtos na mesma URL, ou aplicações web com bases de dados inteiras carregando no HTML.

Mesmo nas páginas de produto de lojas grandes, como a Amazon, que costumam ser pesadas, o HTML não chega a 1MB. 

Logo, sites “normais” – de empresas B2B, blogs, escritórios, entre outros, não chegam nem perto. Em sites desse tipo, os problemas de rastreamento e indexação costumam ser outros

Como checar o tamanho das minhas páginas?

Se você quiser mesmo ter certeza de que está dentro do limite de rastreamento do Google, basta conferir o tamanho dos seus arquivos HTML.

Tem várias ferramentas que fazem isso de forma praticamente automática, como o Screaming Frog. Abaixo tem um exemplo web, da Tools A Day. É só colar a URL que ela mostra o tamanho.

Também dá pra ver manualmente, usando o Chrome Dev Tools. Basta seguir esse caminho: 

  • Clique com o botão direito em qualquer lugar da página;
  • Pressione “Inspecionar”;
  • Na barra lateral, selecione o menu “network”;
  • Dentro do Dev Tools, pressione o botão de recarregar a página.
Captura de tela do Chrome Dev Tools, com destaque para as marcações de tamanho de HTML

Você verá esta tela. O retângulo vermelho representa o tamanho aproximado do HTML. Geralmente, vai aparecer como “document” e será o primeiro item da lista. Nas abas marcadas pelo retângulo amarelo, você pode ver o tamanho de arquivos específicos.

Não se preocupe demais com o tamanho do HTML

Resumindo toda a história: a menos que você tenha um site muito complexo, o limite de rastreamento do Google é um detalhe técnico que não tem relevância no seu SEO.

O Google define e documenta essas limitações por uma questão de escala. A empresa tem bilhões de páginas para rastrear, então ela precisa otimizar os seus recursos de computação.

É a mesma coisa com o crawl budget, que é o limite de rastreamento de cada site. Portais grandes precisam otimizar, para que o Googlebot visite as páginas certas. Para os pequenos, literalmente não faz diferença, já que o rastreador dá conta de tudo. 

Vale a pena entender como funciona, mas provavelmente você não precisa gastar dinheiro corrigindo o tamanho do seu HTML. 🤝Para entender o que você realmente precisa fazer para ter melhores resultados, entre em contato com a SEO Happy Hour e conheça a nossa consultoria!

  • Elyson Gums

    Elyson Gums

    Elyson Gums é redator na SEO Happy Hour. Trabalha com redação e produção de conteúdo para projetos de SEO e inbound marketing desde 2014, em segmentos B2C e B2B. É bacharel em Jornalismo (Univali/SC) e mestre em Comunicação Social (UFPR).

Comentários

0 Comentários

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *