SEO técnico são as otimizações de infraestrutura de um site. Ao melhorar aspectos como navegação, arquitetura, velocidade de carregamento e experiência, as páginas podem ser mais facilmente encontradas nos buscadores.
Os publishers e os portais de notícias têm uma série de particularidades técnicas que, quando ignoradas, podem impedir completamente a indexação de conteúdo no Google.
Por exemplo:
A implementação incorreta de paywall pode impedir a indexação de páginas;
Uma paginação mal feita pode prejudicar a visibilidade de conteúdos mais antigos;
A ausência de sitemapsde notícias pode atrasar a indexação;
Para aparecer no Discover, é necessário atender a uma série de requisitos específicos.
Sem a gestão adequada desses elementos, o conteúdo perde força, mesmo que a qualidade editorial seja excelente.
Neste post, reunimos as principais práticas de SEO para publishers e portais de notícias. São mais de 20 itens que podem melhorar seus resultados no Google e nas IAs.
Como funciona o SEO técnico para publishers e portais de notícias?
Em geral, o SEO técnico para publishers e portais de notícias não é tão diferente do que fazemos para outros tipos de sites. O que muda são algumas nuances em áreas específicas, geralmente relacionadas à publicação e à gestão de grandes volumes de conteúdo.
As ações mais importantes de SEO técnico podem ser agrupadas nas seguintes áreas:
Rastreabilidade e indexação: os pré-requisitos técnicos para que as páginas apareçam corretamente no Google;
Duplicação de URLs: gestão de URLs com conteúdo similar, incluindo o conteúdo sindicado e republicação de notícias;
Arquitetura de site: organização correta de informações, linkagem interna eficiente e implementação de recursos adequados para navegação;
Conteúdo: otimizações técnicas dentro das páginas de notícias, incluindo a marcação correta de dados estruturados e elementos de E-E-A-T;
Experiência de página: implementação correta de anúncios e demais critérios de UX avaliados pelo Google;
Paywall: marcação adequada para conteúdos protegidos por assinatura;
Visibilidade no Discover: o conjunto de aspectos técnicos para que o site esteja presente em feeds do Google Discover;
Configuração de CDN: problemas que podem afetar latência, performance e experiência de página.
Além desses pontos, é importante conhecer alguns conceitosintrodutórios de SEO técnico, aplicáveis a todos os tipos de site.
Temos uma biblioteca de conteúdos desse tipo aqui no site da SEO Happy Hour. Estas são as leituras recomendadas:
JavaScript em SEO: é uma das principais fontes de problemas técnicos de SEO;
Performance em SEO: destaca os aspectos de desempenho de site avaliados pelo Google.
Agora sim, vamos às principais dicas de SEO para portais de notícias!
1. Rastreabilidade e indexação
Rastreabilidaderefere-se à capacidade de um site ser lido corretamente por robôs, também chamados de rastreadores. Eles são usados por mecanismos de busca e por IAs para ler e processar o conteúdo das páginas.
Já a indexaçãoé o processo de adicionar as páginas rastreadas a um índice. Esse índice é uma “lista” de URLs que os buscadores armazenam, consultada sempre que alguém faz uma pesquisa.
Ambos os processos são fundamentais para que uma página apareça no Google.
Há uma série de ações que podem influenciar o rastreamento e a indexação de páginas.Veja abaixo o que fazer em cada uma delas:
Verifique permissões do Googlebot
O que é: Googlebot é o rastreador do Google. Logicamente, se ele não puder acessar uma página, ela não aparece nos resultados do buscador.
Como fazer: revise as diretivas do arquivo robots.txt e de servidores. Certifique-se de que as requisições do Googlebot não estão sendo bloqueadas.
Este é um exemplo de configuração do robots.txt. Ali está escrito que o robô pode acessar o diretório “public”, mas não deve rastrear a pasta “private”.
O que é: metatags robots são marcações HTML adicionadas ao cabeçalho <head> de uma página. Elas permitem configurar alguns detalhes que influenciam a exibição de páginas no Google.
As mais relevantes são:
noindex: informa que a página não deve ser indexada;
nosnippet: informa que trechos da página não devem ser exibidos no Google (incluindo nas AI Overviews).
Como fazer: remova essas tags de todas as páginas que você quer que apareçam no Google.
Mas lembre-se de que nem todas as páginas do seu site devem ser indexadas. É o caso de ambientes internos ou páginas de feed.
Como fazer: a criação do arquivo é bem parecida com um sitemap.xml, mas tem algumas configurações extras:
Deve conter apenas URLs de notícias publicadas nos últimos dois dias;
Precisa conter tags <news>, que indicam ao Google como tratar as URLs.
Os principais plugins de SEO, como Yoast e RankMath, oferecem recursos para criar, configurar e atualizar automaticamente os sitemaps de notícias.
Insira datas de publicação e modificação de conteúdo
O que é: o conteúdo noticioso é naturalmente sensível ao tempo. Logo, em diversas situações, o Google prefere exibir páginas recentes. As IAs têm o mesmo comportamento, dependendo do prompt enviado pelo usuário.
Como fazer: essas informações devem estar no sitemap e no corpo da página.
No sitemap, inclua os atributos <publication_date> e <lastmod> para cada URL. Sitemaps criados com plugins de SEO geralmente já têm os campos configurados.
Na página, é interessante exibir no topo, junto do título, pelo menos a data da última edição.
Gerenciamento de crawl budget
O que é: crawl budget é a “cota de rastreamento” de cada site. O Google não rastreia tudo o que está na internet. Por isso, define uma cota de rastreamento para cada site.
Uma das funções do SEO técnico é garantir que essa cota seja gasta com conteúdos realmente importantes.
Como fazer: há diversas estratégias para priorizar o rastreamento das páginas essenciais, como:
Priorize as páginas importantes ao fazer links internos;
Use diretivas do robots.txt para bloquear diretórios pouco relevantes;
Verifique se as páginas mais importantes estão especificadas no sitemap;
Portais de notícias acumulam muitas páginas no decorrer dos anos, então frequentemente devem se atentar à cota de rastreamento.
Como identificar problemas: acesse o relatório de rastreamento de páginas do Search Console e observe o volume de requisições, se há picos ou quedas e quais páginas são acessadas.
Disponibilidade de servidor
O que é: são problemas de desempenho, configuração e disponibilidade de servidor que afetam a forma como o Google rastreia ou indexa o site.
Indícios de problemas: demora no carregamento das páginas, excesso de erros 5xx e renderização incompleta de páginas indicam que algo está errado.
O que monitorar: observe o tempo de resposta do servidor e quais códigos de resposta HTTP são retornados ao Googlebot. Você pode verificar esses dados no relatório de rastreamento de páginas do Search Console e nos logs de servidor.
Ferramentas como o Lighthouse permitem identificar gargalos de performance que podem prejudicar o rastreamento.
Como corrigir: na maioria das vezes, você precisará do apoio técnico para fazer o “debug” do site e descobrir o que de fato está quebrado.
As boas práticas incluem:
Otimizar cache e usar CDN para diminuir latência;
Auditar o código-fonte do site e verificar se há incompatibilidades;
Observar se há picos de tráfego com os quais o servidor é incapaz de lidar;
Verificar se o Google consegue acessar recursos CSS e JS.
2. Duplicação de conteúdo
A duplicação de conteúdo ocorre quando o site tem duas ou mais URLs idênticas (ou muito parecidas).
Pode ser um problema técnico causado por criação dinâmica de URL, versões HTTP e HTTPS do site, parametrização de URL, entre outras.
Em portais de notícias, causas comuns de conteúdo duplicado são:
Conteúdo sindicado, que é a republicação de matérias de outros portais;
Publicações diárias recorrentes, com pouca variação entre si (por exemplo, matérias “onde ver os jogos do Brasileirão hoje”);
Artigos com múltiplas versões ou URLs parametrizadas;
Conteúdo localizado para variações regionais de um site (www.jornal.com/br e www.jornal.com/pt).
URLs duplicadas causam diversos problemas. Confundem mecanismos de busca, podem prejudicar o rastreamento e, no caso dos sites grandes, gastam crawl budget.
O Google evita ao máximo indexar conteúdo duplicado. Sempre que identificar uma URL duplicada, ele tentará encontrar a versão principal e indexar apenas essa.
Mas, apesar disso, a solução nem sempre é excluir o conteúdo duplicado do site. Em vez disso, é necessário gerenciar as URLs. Veja a seguir como fazer.
Canonização de URLs
O que é: a URL canônica é a “principal” de um grupo de conteúdos similares. Ela é marcada com a tag HTML canonical. Todas as URLs duplicadas também têm a tag, apontando para a URL principal.
Este é um sinal para que o Google entenda qual é a URL certa para indexar. Mas, às vezes, o buscador ignora a diretiva.
O que é: SEO on-page são as otimizações feitas dentro da página do site. Elas também podem indicar ao Google qual URL é a mais importante e deve ser indexada.
Como fazer: a newsletter WTF is SEO traz as seguintes dicas:
Use URLs únicas para diferenciar artigos semelhantes (por exemplo, www.jornal.com/horoscopo-11-11-25);
Insira títulos únicos para as matérias, incluindo datas ou outros fatores que permitam diferenciá-las;
Faça edições de conteúdo, para sinalizar claramente ao Google que é uma página recente, e que não é derivada de uma automação ou de parametrização de URLs;
Sempre que possível, adicione imagens, legendas e textos alternativos diferentes.
Conteúdo sindicado
O que é: conteúdo sindicado é a republicação de matérias em jornais. Por exemplo, quando um portal repete conteúdo de agências de notícias, como a Reuters ou AP.
É comum jornais fazerem isso, mas o Google pode se confundir sobre qual é a versão original. Por isso, é necessário adotar algumas boas práticas específicas, que não envolvem o uso da canonical tag.
Como fazer: as dicas da newsletter SEO for Google Newspara lidar com conteúdo sindicado são:
Bloquear o conteúdo republicado para indexação, usando a tag noidex;
Se o conteúdo sindicado for sempre hospedado no mesmo diretório do site, você pode bloqueá-lo no arquivo robots.txt.
Por que não usar a canonical tag: a marcação de URL canônica apenas sugere ao Google qual versão priorizar, o que nem sempre é suficiente para impedir a indexação de duplicatas.
Por isso, o mais correto é bloquear rastreamento via robots.txt, ou indexação via noindex. Assim, não há sinais conflitantes e ninguém sai prejudicado. Essa recomendação existe desde 2023.
3. Arquitetura de site
A arquitetura de site é a organização de informações dentro do domínio. Inclui a disposição e implementação de elementos como menus, a definição de categorias, sistemas de tags e inventário do conteúdo publicado.
Uma boa estrutura facilita a navegação para humanos e buscadores. Logo, tem diversos benefícios em SEO.
Em portais de notícias, a principal preocupação deve ser manter uma estrutura clara, que funcione mesmo quando o site escala a quantidade de matérias publicadas.
Menus e submenus
O que é: em portais de conteúdo, menus e submenus organizam os principais tópicos abordados.
Ali, ficam links internos para editorias como política, economia, esporte, entre outras. Além de facilitar a navegação, essa organização também comunica ao Google quais são as expertises do portal.
Alguns sites também implementam submenus, que aparecem conforme a pessoa passa o mouse por cima de alguma categoria.
Boas práticas para menus: a implementação dos menus deve seguir algumas diretrizes básicas de SEO para que todos os links sejam visíveis para os rastreadores.
Todos os links devem estar no HTML da página (com a tag <a href=link>), mesmo que o site use animações ou scripts para carregar menus;
Evitar o carregamento de links apenas após o clique. Isso torna esses links invisíveis para os rastreadores, pois eles nunca executam ações ao acessar o site;
Manter estruturas de menu consistentes entre as versões desktop e mobile do site.
Uso de menu suspenso: menus suspensos ou em estilo hambúrguer devem ser usados com cautela, pois podem limitar a exibição de informações. Eles funcionam bem apenas em telas menores.
Evite usar nos menus da versão do site para computadores;
Use para submenus na versão do site para computadores e celulares;
É válido usar em submenus nas versões para computadores e celulares.
Otimize categorias e tags
O que é: páginas de categorias e tags organizam artigos por tema.
As categorias correspondem às editorias do portal, enquanto as tags agrupam matérias mais específicas sobre esse tema.
Por exemplo: “esportes” pode ser uma categoria e “futebol” uma tag.
Ao rastrear o site, o Google analisa as relações entre os links dentro das categorias e tags. Assim, consegue avaliar a autoridade tópica do domínio, o que influencia a presença no buscador.
Não há “números certos” de quantas categorias ou tags o seu portal deve ter.
Como fazer: otimizar categorias e tags significa organizar as pautas que o portal cobre e implementar alguns elementos on-page para conectar os artigos.
Crie tags e categorias apenas para os assuntos que você aborda com frequência;
Evite tags com poucos conteúdos (cinco artigos ou menos);
Consolide tags que cobrem o mesmo assunto (exemplo: Lula, Presidente Lula, Luis Inácio), para consolidar a autoridade;
Mantenha URLs consistentes e padronizadas, como www.site.com/categoria/politica;
Apresente as categorias e tags nos textos de notícias e reportagens. Geralmente as categorias aparecem logo no começo e as tags ao final da matéria;
Adicione as tags por meio de links HTML clicáveis, para que possam ser rastreadas pelos buscadores;
Dentro das páginas de categorias, acrescente paginação adequada (veja como fazer na seção seguinte deste guia);
Para categorias sensíveis ao tempo, crie as tags e URL sem menção ao ano (por exemplo, “Finais da NBA” em vez de “Finais da NBA 2025”). A ideia é agrupar o conteúdo de todos os anos nessa tag;
O que é: a paginação é o sistema que distribui artigos em lista dentro de um site. Em publishers, geralmente aparecem nas páginas de editoria para que o leitor possa navegar pelos conteúdos antigos.
Há uma série de recomendações de SEO para paginação. Se não forem seguidas, os itens das páginas 2 em diante podem ficar completamente inacessíveis aos rastreadores.
Tipos de paginação: o Google descreve três tipos principais:
Paginação: tem botões de “anterior”, “próximo” e listas de páginas numeradas;
Ver mais: o visitante clica no botão e uma lista adicional de páginas é exibida.
Rolagem infinita: quando a pessoa rola a página até o final, mais conteúdo é carregado.
Como implementar: cada tipo tem as suas próprias boas práticas de SEO.
O modelo mais indicado é a paginação sequencial, com as páginas 2, 3, 4 etc.
A documentação do Google traz as seguintes boas práticas:
Vincular páginas por meio de tags HTML <a href>;
Vincular todas as páginas subsequentes à primeira;
Usar um URL exclusivo para cada página (usando slugs como pagina/politica/2, pagina/politica/3, etc.);
Usar uma tag canonical em cada página da lista, apontando para si mesma. Por exemplo, pagina/politica/2 deve ter a canonical pagina/politica/2, a página 3 deve ter a canônica pagina/politica/3 e assim por diante;
Não usar URLs com fragmento (# na slug) na paginação;
O SEO técnico nas páginas de conteúdo oferece mais contexto sobre cada URL aos buscadores. A ideia é oferecer informações em formatos legíveis por máquina, para que haja mais clareza no ranqueamento daquele conteúdo.
As implementações técnicas também contribuem para comunicar ao Google o E-E-A-T do site. Esta é a sigla de Experiência, Expertise, Autoridade e Confiança, os atributos de qualidade avaliados pela big tech.
Leitura complementar: publicamos recentemente um guia de SEO para notícias, que cobre alguns aspectos técnicos e de SEO on-page para páginas de conteúdo.
Marcação de dados estruturados
O que é: dados estruturados são informações adicionais sobre uma página, inseridas no cabeçalho <head> da página. Eles são escritos em formatos legíveis por máquinas, geralmente em JSON e seguindo a convenção Schema.
Para publishers, os dados estruturados mais importantes são:
Article: para artigos informativos gerais;
BlogPosting: para artigos publicados em blogs;
NewsArticle: conteúdos noticiosos;
Organization e NewsMediaOrganization: informa quem é o publisher ou portal de notícias.
LiveBlogPosting: deve ser usado para coberturas ao vivo.
Também há algumas propriedades de dados que devem ser adicionadas:
headline: título da matéria;
image: URL da imagem destacada;
datePublished e dateModified: para indicar datas de publicação e modificação do artigo;
ahuthor: nome de quem escreveu a matéria;
isAcessibleForFree: para indicar conteúdo protegido por paywall.
O que é: o aspecto técnico das imagens influencia como elas aparecem em produtos Google, como Discover e Imagens. Os principais elementos são o formato, o tamanho e os textos associados a cada arquivo.
Como fazer: as otimizações técnicas de imagens são:
Formato de imagem: JPEG ou WEBP para imagens gerais, PNG quando precisar de fundos transparentes, SVG para logos;
Nome de arquivos: use nomes descritivos (evento-cop30-belem.jpg em vez de IMG543545.jpg);
Texto: adicione sempre um texto alternativo que descreve o que há na imagem. Seja específico, descritivo e transcreva qualquer texto que apareça na imagem. Insira também um título e legendas para a imagem, para contextualizar o conteúdo;
URL: as URLs devem ser rastreáveis e indexáveis, inseridas via elemento HTML sempre que possível. A estrutura de URL das imagens deve ser padronizada e descritiva.
Tamanho de imagem: prefira imagens leves, com menos de 150 kb, sempre que possível. Em relação ao tamanho em pixels, use o atributo srcset para exibir o tamanho adequado para cada tamanho de tela.
As dicas são da newsletter WTF is SEO. Elas se aplicam a sites de todos os tipos, além de publishers.
Portanto, ambos devem estar alinhados para evitar exibição errada. Isso é importante para todos os tipos de site, mas ainda mais para notícias, em que a atualidade é um fator crucial.
Como fazer: basta verificar se há a mesma data e hora nos seus dados estruturados, no CMS e na página exibida ao público.
Como identificar: selecione uma URL e compare as datas e horários em todos os locais. Escolha uma página que já está bem ranqueada, para verificar se está aparecendo certo no Google.
Fortaleça a linkagem interna
O que é: links internos são um dos elementos principais de SEO. São hyperlinks que apontam para outras páginas do seu site, com o objetivo de facilitar a navegação, indicar conteúdo relacionado e transmitir autoridade entre as URLs.
Em publishers e portais de notícias, os links internos ocupam diversas funções:
Orientar a navegação dentro de menus;
Conectando textos que compartilham tags e categorias;
Apresentando notícias relacionadas, que cobrem o mesmo tema ou são desdobramentos de um fato;
Conectar autores às notícias e reportagens escritas por eles.
Boas práticas para links internos: as principais recomendações são inserir os links internos de forma contextualmente relevante em todo o site. Os links devem ser inseridos sempre via HTML, com a tag <a href>.
Insira links internos para notícias relacionadas, dentro do bloco principal de conteúdo da página;
Insira links para páginas de tag e de categorias;
Faça links apenas na primeira menção do tema. Evite linkar a mesma matéria várias vezes;
Evite links superficiais e irrelevantes;
Use textos de links claros e diretamente relacionados com a página de destino;
Faça auditorias frequentes para identificar e, quando possível, substituir links quebrados.
5. Experiência de página
O que é: a experiência de página define o quanto é agradável e intuitivo navegar em um site, por meio de diversos indicadores específicos.
O Google tem uma série de critérios aplicados a todos os tipos de site, incluindo publishers e portais de notícias. São eles:
Ausência de publicidade intrusiva;
Presença de protocolo HTTPS;
Bom desempenho em dispositivos móveis;
Velocidade de carregamento, estabilidade visual e latência, avaliados com indicadores chamados Core Web Vitals.
Nos sites de notícias, os anúncios são os principais vilões da experiência do usuário. É fácil encontrar reclamações sobre a quantidade (e a qualidade) dos anúncios, e não é de hoje.
Leituras complementares: aqui no site da SHH, temos três guias que apresentam os conceitos fundamentais de experiência de página. Recomendamos muito a leitura.
UX e SEO: demais elementos de interface que podem interferir na usabilidade do site;
Performance de site: apresenta os principais conceitos e boas práticas relacionados à velocidade de carregamento.
Estes guias são gerais, com informações que se aplicam a todos os tipos de site. Veja abaixo algumas considerações específicas para portais de notícias e publishers.
Melhore sua pontuação nas métricas de Core Web Vitals (CWV)
O que é:Core Web Vitals são indicadores técnicos de experiência de página avaliados pelo Google.
Cumulative Layout Shift (CLS): mede a estabilidade visual da página (elementos que não “mudam de lugar” de forma inesperada enquanto são carregados). A pontuação deve ser menor que 0,1.
Como fazer: as ações são feitas com apoio do time de desenvolvimento. Geralmente, envolvem redução dos arquivos JS e CSS e otimização de recursos, como imagens.
O Google tem documentações do que fazer para melhorar cada métrica:
Na verdade, em sites de notícias é quase impossível ter pontuação máxima. Diversos elementos são obrigatórios e prejudicam o desempenho, como os anúncios.
Além disso, as otimizações dependem de um conhecimento altamente especializado, que nem sempre está facilmente disponível nas redações. Por isso, é importante priorizar adequadamente o trabalho do time. E, nesse processo, nem sempre as Core Web Vitals serão a otimização mais importante.
Você deve se concentrar em:
Ter uma boa pontuação, dentro do que a realidade atual do seu site permite;
Entregar boa experiência aos visitantes, mais do que subir a pontuação só por subir;
Monitorar o desempenho continuamente;
Não entrar em pânico com notas regulares, mas agir caso estejam muito baixas.
Pessoalmente, o meu preferido é o PageSpeed Insights, que dá uma visão geral bem rápida do site. Basta digitar a URL e você verá uma lista com as métricas e com os problemas de desempenho.
Anúncios e UX
O que é: o excesso de anúncios atrapalha a experiência de usuário e o desempenho do site.
Na teoria, todos os portais deveriam ter um número razoável de propagandas, sem atrapalhar a navegação e a exibição do conteúdo.
Mas na prática, é muito difícil manter esse equilíbrio. Frequentemente os jornais precisam de muita propaganda para gerar receita, e os anúncios que pagam melhor são justamente os mais invasivos.
O que levar em consideração: a decisão de quantos anúncios exibir e onde inseri-los na página é principalmente de negócios. Mas também pode ter algumas implicações no SEO técnico do site:
O Google recomenda evitar os intersticiais invasivos, que são os pop-ups que obstruem o conteúdo;
Excesso de anúncios torna o site mais lento;
Dependendo de como forem carregados, os anúncios prejudicam o rastreamento do site e fazem com que elementos de página mudem de lugar.
Boas práticas: as considerações técnicas para implementar anúncios incluem:
Usar técnicas de carregamento condicional, como lazy loading, para carregar primeiro o conteúdo da página e depois os anúncios;
Tentar minimizar o uso de JS ao incluir anúncios no site;
Verificar se os anúncios mudam de lugar ou de tamanho depois que os demais elementos da página são carregados, pois isso afeta o LCS;
Monitorar impacto dos anúncios em crawl budget (para sites grandes) e no tempo de renderização de páginas;
Substituir pop-ups intrusivos por banners sempre que possível;
Verificar o impacto dos anúncios também nas versões móveis dos sites.
Gerenciamento de AMP
O que é: AMP é a sigla para Accelerated Mobile Pages (Páginas Aceleradas para Dispositivos Móveis, em português). É uma estrutura HTML simplificada, que carrega mais rapidamente em dispositivos móveis.
Durante muito tempo, páginas AMP eram obrigatórias em certos recursos de notícias do Google. Mas desde 2020 o formato vem perdendo suportee hoje não é mais necessário.
O que fazer: se você já tem páginas AMP implementadas, tecnicamente não precisa fazer nada. Elas não são obrigatórias, mas também não causam prejuízos.
Mas, estando no seu site, você precisa dar uma olhadinha nelas para fazer a manutenção. Logo, muitas vezes não faz sentido manter. Se for o seu caso, simplesmente faça um redirect 301 de cada URL para sua versão sem AMP.
Atenção para experiência móvel: o Google não usa mais a AMP, mas avalia usabilidade em celulares e tablets de outras formas. Portanto, mantenha boas práticas, como design responsivo.
6. Implementação de paywall
Paywall é o sistema que restringe conteúdo a assinantes. Hoje, é uma das principais formas de monetizar portais de conteúdo.
Em termos de SEO técnico, é um pouquinho mais complexo. O paywall implica que os rastreadores devem ver uma página, enquanto os visitantes devem ver outra.
Para que a página seja indexada, o Googlebot deve ter acesso ao que está atrás do paywall. Mas um visitante humano deve ser recebido por uma tela que exige os seus dados de autenticação.
E fica ainda mais complexo quando consideramos os diferentes tipos de paywall:
Introdução, em que o visitante vê apenas o título e no máximo o primeiro parágrafo do conteúdo;
Freemium, onde alguns conteúdos do site são gratuitos e outros são pagos;
Limitado, onde cada visitante tem um número de leituras gratuitas por mês;
Dinâmico, gerenciado por softwares que definem permissões com base no comportamento da audiência.
Diretrizes técnicas para paywall
O que é: o Google rastreia e indexa conteúdo protegido por paywall normalmente, mas o sistema deve ser claramente comunicado aos rastreadores.
Além disso, o tipo de paywall selecionado também pode influenciar o SEO do site.
Segundo o buscador, mudanças em paywalls podem “prejudicar a experiência do usuário e afetar involuntariamente a classificação do artigo na Pesquisa Google, pois o acesso do usuário é restrito”.
No formato limitado, o buscador consegue rastrear todo o conteúdo. Cada visita do Googlebot contará como a primeira. Logo, o paywall não ativa e a página é rastreada igual a qualquer outra.
Já no formato introdução, o Googlebot processará apenas a parte visível aos visitantes. Ou seja, não terá acesso a toda a página, o que oferece menos contexto para ranquear o seu site.
Orientações técnicas: para comunicar ao Google que um conteúdo tem paywall, e quais partes são visíveis para os visitantes, você deve fazer o seguinte:
Usar o dado estruturado isAccessibleForFree, com uma marcação de “true” ou “false”;
Acrescentar o atributo cssSelector para indicar a presença do paywall.
Como inserir o paywall: o paywall pode ser adicionado de diferentes formas: com HTML, JS, com dados estruturados, ou bloqueando totalmente o conteúdo.
Para SEO, use sempre HTML ou JS (paywall do lado do cliente ou do lado do servidor).
Paywall do lado do servidor
É o melhor do ponto de vista de SEO, mas o mais difícil de implementar. Ele mostra arquivos HTML diferentes para o Googlebot e para visitantes humanos. Assim, o Google têm acesso a todo o conteúdo na hora de rastrear a página.
Se você não implementar corretamente os dados estruturados de paywall, o Google pode confundir o conteúdo com cloaking e penalizar seu site.
Paywall do lado do cliente
É carregado por JavaScript. É mais fácil de implementar, mas bem mais fácil de burlar também – basta desabilitar o JavaScript da página e todo o conteúdo aparece, mesmo sem pagar.
Segundo o Google, é necessário ter cautela na implementação, para que isto não ocorra:
Algumas soluções de paywall em JavaScript incluem o conteúdo completo na resposta do servidor e usam JavaScript para ocultá-lo até que o status da assinatura seja confirmado. Essa não é uma maneira confiável de limitar o acesso ao conteúdo. Verifique se o paywall só fornece o conteúdo completo depois que o status da assinatura é confirmado.
Paywall com dados estruturados
Nesse tipo de paywall, o texto do artigo não aparece no HTML da página, apenas dentro da propriedade ArticleBody, no cabeçalho <head>.
Assim, o Google consegue ler o conteúdo, mas não lê os links internos da página, o que reduz o seu valor para SEO.
Paywall com conteúdo totalmente bloqueado
Neste modelo, o HTML com o conteúdo não é exibido nem para os visitantes, nem para o Googlebot.
Quando um visitante não autenticado acessa a página, recebe apenas os arquivos solicitando a autenticação. No máximo, são exibidas informações limitadas sobre a página.
É um paywall difícil de quebrar, mas pode influenciar o SEO do site, por dificultar ao Google ler o texto.
Offerwall
O que é: o offerwall é uma alternativa relativamente nova do paywall. Em vez de cobrar assinaturas, os sites podem exigir pequenas ações ou microtransações para liberar cada página individualmente.
O sistema passou a receber suporte do Google em 2025, como uma forma alternativa de monetização.
Como implementar: o paywall é inserido e controlado pelo Google Ads Manager. É possível personalizar as ações e a inclusão e exclusão de páginas por meio de JavaScript próprio.
Logo, será necessário contar com o apoio de uma equipe de desenvolvimento, e respeitar as boas práticas recomendadas de JavaScript para SEO, para evitar quedas de performance do site.
7. Visibilidade no Discover
O Google Discover é um dos principais recursos do Google para publishers e sites de notícias. É um feed de conteúdo personalizado, exibido em celulares (e, ao que tudo indica, em breve em computadores também).
Diferentemente da pesquisa orgânica, o Discover é muito mais volátil. Páginas entram e saem de lá com frequência, o Google não discute claramente como o sistema de recomendações funciona e há muita personalização nos feeds.
Também há uma série de otimizações técnicas específicas para o Discover:
Imagens devem ter no mínimo 1200 pixels de largura e conter a meta tag max-image-preview:large;
Dados estruturados devem ser corretamente implementados;
O conteúdo deve ter formato compatível com o Discover, como web stories.
No mais, as recomendações técnicas que valem para a pesquisa orgânica também são importantes para o discover: uso de URL canônica e hreflang quando relevante, bom desempenho de site, visibilidade mediada por diretivas do robots.txt e tag noindex, etc.
8. Configuração de CDN
Uma CDN é uma rede de servidores usada para disponibilizar conteúdo da web com mais eficiência. Ela permite carregar conteúdo mais rapidamente, cachear conteúdo estático e exibir conteúdo dinâmico com mais estabilidade e velocidade.
Em muitos tipos de site, usar uma CDN é praticamente um pré-requisito. Publishers e portais de notícias não fogem à regra, principalmente os que têm audiência internacional ou grande volume de páginas.
A configuração adequada influencia o rastreamento, a indexação, o crawl budget, as métricas da Core Web Vitals, entre outros aspectos.
Para portais de notícias, as principais recomendações são:
Servir conteúdo estático via CDN;
Garantir que o CDN não está bloqueando o acesso do Googlebot a esse conteúdo;
Verificar se as URLs servidas via CDN são rastreáveis e indexáveis;
Configurar cabeçalhos HTTP de cache adequadamente;
Definir tempo de TTL para que notícias recentes sejam atualizadas mais rapidamente;
Verificar se o CDN oferece suporte para protocolo HTTPS, que faz parte dos requisitos de experiência do Google. Geralmente os provedores já oferecem isso de forma nativa.
Como realizar as otimizações de SEO técnico?
Eita, quanta dica! 😅
Agora que você já viu tudo o que influencia o SEO técnico para portais de notícias e publishers, chegou a parte difícil: colocar tudo isso em prática.
Você dificilmente realizará todas as ações que estão nessa lista. Elas tomam muito tempo, muitos tickets para o time de desenvolvimento, muitas reuniões com todos os envolvidos, aprovação de recursos para certas ações, decisões que envolvem negócios além de técnica…
Além disso, terá que dividir o seu tempo entre as otimizações técnicas e as de outras áreas do SEO, como on-page e off-page.
Identificar os gargalos que podem estar prejudicando o SEO do site;
Classificar o potencial de retorno delas vs. o esforço para implementar.
Comece pelo que for fácil e tiver maior potencial de retorno. Aos poucos, vá afunilando e acompanhando o resultado das otimizações.
Um detalhe importante, que se aplica a sites de notícias e de outros tipos, é não seguir cegamente as ferramentas de SEO. Elas podem ajudar a mapear problemas, mas dificilmente oferecerão o contexto necessário para realmente melhorar o desempenho do seu site.
Para ter apoio especializado na auditoria técnica do seu site, entre em contato com a SEO Happy Hour! Trabalhamos com grandes portais de notícias brasileiros, então temos a experiência necessária para apontar os caminhos mais rápidos e lucrativos para seu site aparecer no Google.
Elyson Gums é redator na SEO Happy Hour. Trabalha com redação e produção de conteúdo para projetos de SEO e inbound marketing desde 2014, em segmentos B2C e B2B. É bacharel em Jornalismo (Univali/SC) e mestre em Comunicação Social (UFPR).
Comentários