Vale a pena publicar páginas em markdown para SEO? Porta-vozes do Google respondem

Uma dica de SEO que ganhou popularidade recentemente é publicar versões em markdown (.md) das suas páginas. É um formato mais simples de ler, o que teoricamente oferece uma visão mais limpa e clara do seu site para as IAs.

E o formato realmente recebeu suporte do mercado. A Cloudflare lançou uma ferramenta que converte automaticamente sites em MD e o (polêmico) arquivo llms.txt também é nesse formato…

No entanto, segundo o Google, é desnecessário criar páginas em markdown para SEO. Os rastreadores, responsáveis por processar o conteúdo das pásginas na webm foram criados para processar HTML, inclusive os de baixa qualidade. Logo, não há necessidade de mudar o formato agora, pensando em obter visibilidade, tráfego e citações.

Martin Splitt e John Mueller, porta-vozes da big tech, discutiram o tema em detalhes no último episódio do podcast Search Off the Record. Veja abaixo um resumo traduzido da conversa.

O que é o markdown e como se diferencia do HTML?

O Markdown é um formato simplificado de marcação de textos. Ele nasceu com o propósito de facilitar a leitura, a escrita e a conversão em HTML para exibição de páginas.

Se você usa o Discord, Slack ou WhatsApp, já teve contato com alguns dos seus elementos, como usar ** para negritar texto e * ou _ para deixar em itálico. Em HTML, o equivalente é <b></b> e <i></i>, ou <strong></strong> e <em></em>.

Bem mais complicado, né?

Além de simples, o Markdown também é semântico. Ou seja, cada marcação tem um significado único, claro e definido.

Se tem # é título, um elemento de destaque da página, sem conversa.

Em HTML, você pode usar uma tag de título, ou aumentar o tamanho da fonte para dar destaque, sem que isso tenha um significado estrutural na página. Ou seja, visualmente a tag produz um efeito, mas seu significado é outro. Com <b> e <strong> é o mesmo caso, ambas geram negritos, mas carregam sentidos diferentes na estrutura da página.

O visitante humano que acessa a página consegue entender tudo com facilidade, não importa qual tag foi usada. Mas sistemas automatizados precisam navegar pela ambiguidade para interpretar o código.

A importância do markdown para a IA

A Cloudflare argumenta que o markdown traz diversos benefícios para as IAs. Como as marcações são simples e diretas, a IA gasta menos tokens para compreender o que está em um arquivo MD.

A razão é a sintaxe:

  • Processar a linha ##Sobre consome cerca de 3 tokens;
  • Processar a linha <h2 class=”section-title” id=”about”>About Us</h2> consome cerca de 12 a 15.

Somando-se a scripts, blocos <div>, elementos de navegação, entre tantos outros, o consumo fica ainda maior.

Em um artigo em seu blog, a Cloudflare indica que o markdown se tornará a “linguagem” dos agentes de IA. E que, por isso, será um “passo comum” transformar páginas de HTML para markdown, e hospedar ambas em seu site.

O podcast do Google não aborda essa argumentação, mas ela é importante para entender o contexto da conversa, pois é a partir daqui que começa a confusão: markdown consumir menos tokens não tem nada a ver com melhorar resultados de SEO.

Como o Google e a IA leem as suas páginas da web?

Todas as plataformas onde o SEO atua (buscadores e IAs) usam rastreadores, ou crawlers, para acessar conteúdo. São robôs que descobrem URLs, acessam páginas, processam o seu conteúdo e, no caso dos buscadores, alimentam os índices.

Esses robôs estão há décadas consumindo HTML. Extrair o conteúdo das páginas não é um problema, pois eles conseguem identiicar e processar o bloco principal de conteúdo (chamado de Main Content, ou MC, pelo Google) em meio a todos os scripts e tags HTML.

Indo além: essas marcações, tags, scripts, elementos de navegação, headers, links internos, entre outros elementos HTML, carregam informação consigo. 

Remover o HTML é remover contexto

Remover o HTML significa remover sinais que podem ser benéficos para a descoberta e ranqueamento de páginas. Em uma versão “crua” da URL, é mais difícil entender como os elementos se conectam e se organizam dentro da arquitetura do site.

Nas palavras de John Mueller:

“Ter um site que utilize HTML padrão em suas páginas é fundamental, pois um mecanismo de busca ou rastreador pode simplesmente acessar essa página. Ele consegue reconhecer todos os outros links dentro do site. […] Ter páginas em HTML padrão é, basicamente, a coisa mais importante que você pode fazer. […] Obviamente, a web é incrivelmente desorganizada, e às vezes as pessoas colocam arquivos de texto simples ou PDFs online, e os rastreadores precisam lidar com parte disso também. Mas eles definitivamente sabem como lidar com páginas HTML. Isso é, de certa forma, a base da web”. 

Links internos são um ótimo exemplo. Eles são um dos fundamentos mais antigos do SEO, pois permitem que os rastreadores naveguem pelas páginas e descubram novas URLs. Além disso, por meio desses links, o Google entende quais são as URLs mais relevantes dentro de um site (recebem muitos links).

Para que tudo isso ocorra, os rastreadores seguem tags HTML. Mais especificamente, a <a href>, que indica com clareza a existência de um link que o rastreador deve acompanhar. Sem o link, todo esse contexto fica invisível. 

Assim, o argumento da Cloudflare, de que “HTML consome tokens desnecessariamente”, não é relevante quando falamos de SEO no geral. 

Apresentar uma versão do seu site em markdown NÃO vai ajudar o seu SEO

Seu site não terá resultados melhores ao apresentar versões markdown para os buscadores. Na verdade, você terá novos problemas para resolver:

  • Automatizar a conversão das páginas de HTML para MD;
  • Gerenciar duas versões paralelas do seu site;
  • Lidar com possíveis problemas de duplicação de conteúdo e cloaking.

Ter uma versão em HTML é o suficiente para a maioria das ocasiões. 

A infraestrutura dos buscadores e das IAs consegue compreender até o HTML considerado ruim, como é o caso da maioria das páginas da web

Logo, se o seu site está com resultados abaixo do esperado, provavelmente o problema está em outro lugar: otimização técnica, SEO on-page, estratégia de conteúdo, entre outros elementos.

Esse é o fundamento da visibilidade de sites há décadas. Não vai mudar agora, nem no futuro próximo – inclusive, até as dicas de otimização de sites para agentes de IA do Google reforçam a importância de melhorar o HTML, não substituí-lo. 

Quando vale a pena usar markdown?

Apesar de tudo, o markdown tem casos de uso dentro de sites. Devido à sua simplicidade, ele realmente traz algumas vantagens para as IAs.

O próprio John Mueller explica uma dessas situações, durante o podcast: 

“Se você fornecer um arquivo Markdown a um LLM, fica muito mais fácil para ele entender — OK, esse é o mecanismo aqui. Portanto, suspeito que, para sites que oferecem exemplos de código e interação com desenvolvedores, ter versões em Markdown da documentação técnica faça algum sentido”.

A ideia, nesses casos, é usar versões em HTML para visitantes humanos e mecanismos de busca tradicionais. A versão Markdown deve estar disponível apenas caso um agente de IA realmente necessite dela.

Perceba que a função é completamente diferente: o objetivo não é ajudar no SEO, no sentido de fazer o seu site receber mais tráfego ou aparecer mais no Google. O markdown ajuda agentes a realizarem tarefas dentro do seu site, o que pode se tornar relevante dentro de alguns anos, caso os agentes de IA tornem-se mais populares.

O caso do arquivo llms.txt

John Mueller e Martin Splitt também discutiram o arquivo llms.txt, um dos mais polêmicos dos últimos tempos em SEO. 

Trata-se de um arquivo com instruções resumidas de um site para as IAs, publicado em formato markdown. É um protocolo que ainda não foi amplamente aceito, mas que se tornou popular com a premissa de “tornar sites mais amigáveis para as IAs”.

O Google, mais de uma vez, explicou qual a utilidade do llms.txt:

  • Não tem função dentro do SEO;
  • Não ajuda sistemas de IA a descobrirem o seu site;
  • Pode trazer benefícios quando um agente de IA está no seu site e precisa de contexto para uma tarefa;
  • O llms.txt pode oferecer instruções para realizar uma ação, ou indicar documentações específicas.

John Mueller sintetizou a discussão da seguinte maneira: 

“A ideia de usar isso como uma forma de otimizar a descoberta por sistemas de IA ou por mecanismos de busca — isso não faz o menor sentido. Porque, basicamente, é como se você estivesse dizendo a esses sistemas: ‘Tenho o melhor site de todos os tempos, e aqui estão todas as páginas que todo mundo precisa visitar’. […] Nenhuma dessas abordagens se consolidou como a única que todos vão usar”.

Quais são as boas práticas para o seu site

Construa sites com bom conteúdo, otimizações on-page e estrutura técnica correta. Publique em HTML mesmo, com boa linkagem interna e facilitando o rastreamento ao máximo.

Ou seja, faça o SEO de sempre. As boas práticas não mudaram.

Se o seu site tem documentações, APIs e afins, você pode criar uma versão markdown, originada da mesma fonte da versão em HTML, e referenciar a URL dentro de um arquivo llms.txt.

Mas, para a maioria dos sites, como e-commerces, blogs, empresas B2B e publishers, não há razão para converter tudo em markdown. Não faz sentido se considerarmos a lógica dos crawlers e o possível futuro com os agentes de IA. 

__

Se você quer melhorar o seu SEO, invista nas ações que realmente têm o potencial de levantar os seus números. E, para quem precisa de apoio profissional para identificar as melhores oportunidades, basta entrar em contato com a SEO Happy Hour

  • Elyson Gums

    Elyson Gums

    Elyson Gums é redator na SEO Happy Hour. Trabalha com redação e produção de conteúdo para projetos de SEO e inbound marketing desde 2014, em segmentos B2C e B2B. É bacharel em Jornalismo (Univali/SC) e mestre em Comunicação Social (UFPR).

Comentários

0 Comentários

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *