Uma dica de SEO que ganhou popularidade recentemente é publicar versões em markdown (.md) das suas páginas. É um formato mais simples de ler, o que teoricamente oferece uma visão mais limpa e clara do seu site para as IAs.
E o formato realmente recebeu suporte do mercado. A Cloudflare lançou uma ferramenta que converte automaticamente sites em MD e o (polêmico) arquivo llms.txt também é nesse formato…
No entanto, segundo o Google, é desnecessário criar páginas em markdown para SEO. Os rastreadores, responsáveis por processar o conteúdo das pásginas na webm foram criados para processar HTML, inclusive os de baixa qualidade. Logo, não há necessidade de mudar o formato agora, pensando em obter visibilidade, tráfego e citações.
Martin Splitt e John Mueller, porta-vozes da big tech, discutiram o tema em detalhes no último episódio do podcast Search Off the Record. Veja abaixo um resumo traduzido da conversa.
O que é o markdown e como se diferencia do HTML?
O Markdown é um formato simplificado de marcação de textos. Ele nasceu com o propósito de facilitar a leitura, a escrita e a conversão em HTML para exibição de páginas.
Se você usa o Discord, Slack ou WhatsApp, já teve contato com alguns dos seus elementos, como usar ** para negritar texto e * ou _ para deixar em itálico. Em HTML, o equivalente é <b></b> e <i></i>, ou <strong></strong> e <em></em>.
Bem mais complicado, né?
Além de simples, o Markdown também é semântico. Ou seja, cada marcação tem um significado único, claro e definido.
Se tem # é título, um elemento de destaque da página, sem conversa.
Em HTML, você pode usar uma tag de título, ou aumentar o tamanho da fonte para dar destaque, sem que isso tenha um significado estrutural na página. Ou seja, visualmente a tag produz um efeito, mas seu significado é outro. Com <b> e <strong> é o mesmo caso, ambas geram negritos, mas carregam sentidos diferentes na estrutura da página.
O visitante humano que acessa a página consegue entender tudo com facilidade, não importa qual tag foi usada. Mas sistemas automatizados precisam navegar pela ambiguidade para interpretar o código.
A importância do markdown para a IA
A Cloudflare argumenta que o markdown traz diversos benefícios para as IAs. Como as marcações são simples e diretas, a IA gasta menos tokens para compreender o que está em um arquivo MD.
A razão é a sintaxe:
Processar a linha ##Sobre consome cerca de 3 tokens;
Processar a linha <h2 class=”section-title” id=”about”>About Us</h2> consome cerca de 12 a 15.
Somando-se a scripts, blocos <div>, elementos de navegação, entre tantos outros, o consumo fica ainda maior.
Em um artigo em seu blog, a Cloudflare indica que o markdown se tornará a “linguagem” dos agentes de IA. E que, por isso, será um “passo comum” transformar páginas de HTML para markdown, e hospedar ambas em seu site.
O podcast do Google não aborda essa argumentação, mas ela é importante para entender o contexto da conversa, pois é a partir daqui que começa a confusão: markdown consumir menos tokens não tem nada a ver com melhorar resultados de SEO.
Como o Google e a IA leem as suas páginas da web?
Todas as plataformas onde o SEO atua (buscadores e IAs) usam rastreadores, ou crawlers, para acessar conteúdo. São robôs que descobrem URLs, acessam páginas, processam o seu conteúdo e, no caso dos buscadores, alimentam os índices.
Esses robôs estão há décadas consumindo HTML. Extrair o conteúdo das páginas não é um problema, pois eles conseguem identiicar e processar o bloco principal de conteúdo (chamado de Main Content, ou MC, pelo Google) em meio a todos os scripts e tags HTML.
Indo além: essas marcações, tags, scripts, elementos de navegação, headers, links internos, entre outros elementos HTML, carregam informação consigo.
Remover o HTML é remover contexto
Remover o HTML significa remover sinais que podem ser benéficos para a descoberta e ranqueamento de páginas. Em uma versão “crua” da URL, é mais difícil entender como os elementos se conectam e se organizam dentro da arquitetura do site.
Nas palavras de John Mueller:
“Ter um site que utilize HTML padrão em suas páginas é fundamental, pois um mecanismo de busca ou rastreador pode simplesmente acessar essa página. Ele consegue reconhecer todos os outros links dentro do site. […] Ter páginas em HTML padrão é, basicamente, a coisa mais importante que você pode fazer. […] Obviamente, a web é incrivelmente desorganizada, e às vezes as pessoas colocam arquivos de texto simples ou PDFs online, e os rastreadores precisam lidar com parte disso também. Mas eles definitivamente sabem como lidar com páginas HTML. Isso é, de certa forma, a base da web”.
Links internos são um ótimo exemplo. Eles são um dos fundamentos mais antigos do SEO, pois permitem que os rastreadores naveguem pelas páginas e descubram novas URLs. Além disso, por meio desses links, o Google entende quais são as URLs mais relevantes dentro de um site (recebem muitos links).
Para que tudo isso ocorra, os rastreadores seguem tags HTML. Mais especificamente, a <a href>, que indica com clareza a existência de um link que o rastreador deve acompanhar. Sem o link, todo esse contexto fica invisível.
Assim, o argumento da Cloudflare, de que “HTML consome tokens desnecessariamente”, não é relevante quando falamos de SEO no geral.
Apresentar uma versão do seu site em markdown NÃO vai ajudar o seu SEO
Seu site não terá resultados melhores ao apresentar versões markdown para os buscadores. Na verdade, você terá novos problemas para resolver:
Automatizar a conversão das páginas de HTML para MD;
Esse é o fundamento da visibilidade de sites há décadas. Não vai mudar agora, nem no futuro próximo – inclusive, até as dicas de otimização de sites para agentes de IA do Google reforçam a importância de melhorar o HTML, não substituí-lo.
Quando vale a pena usar markdown?
Apesar de tudo, o markdown tem casos de uso dentro de sites. Devido à sua simplicidade, ele realmente traz algumas vantagens para as IAs.
O próprio John Mueller explica uma dessas situações, durante o podcast:
“Se você fornecer um arquivo Markdown a um LLM, fica muito mais fácil para ele entender — OK, esse é o mecanismo aqui. Portanto, suspeito que, para sites que oferecem exemplos de código e interação com desenvolvedores, ter versões em Markdown da documentação técnica faça algum sentido”.
A ideia, nesses casos, é usar versões em HTML para visitantes humanos e mecanismos de busca tradicionais. A versão Markdown deve estar disponível apenas caso um agente de IA realmente necessite dela.
Perceba que a função é completamente diferente: o objetivo não é ajudar no SEO, no sentido de fazer o seu site receber mais tráfego ou aparecer mais no Google. O markdown ajuda agentes a realizarem tarefas dentro do seu site, o que pode se tornar relevante dentro de alguns anos, caso os agentes de IA tornem-se mais populares.
O caso do arquivo llms.txt
John Mueller e Martin Splitt também discutiram o arquivo llms.txt, um dos mais polêmicos dos últimos tempos em SEO.
Trata-se de um arquivo com instruções resumidas de um site para as IAs, publicado em formato markdown. É um protocolo que ainda não foi amplamente aceito, mas que se tornou popular com a premissa de “tornar sites mais amigáveis para as IAs”.
O Google, mais de uma vez, explicou qual a utilidade do llms.txt:
Não tem função dentro do SEO;
Não ajuda sistemas de IA a descobrirem o seu site;
Pode trazer benefícios quando um agente de IA está no seu site e precisa de contexto para uma tarefa;
O llms.txt pode oferecer instruções para realizar uma ação, ou indicar documentações específicas.
John Mueller sintetizou a discussão da seguinte maneira:
“A ideia de usar isso como uma forma de otimizar a descoberta por sistemas de IA ou por mecanismos de busca — isso não faz o menor sentido. Porque, basicamente, é como se você estivesse dizendo a esses sistemas: ‘Tenho o melhor site de todos os tempos, e aqui estão todas as páginas que todo mundo precisa visitar’. […] Nenhuma dessas abordagens se consolidou como a única que todos vão usar”.
Quais são as boas práticas para o seu site
Construa sites com bom conteúdo, otimizações on-page e estrutura técnica correta. Publique em HTML mesmo, com boa linkagem interna e facilitando o rastreamento ao máximo.
Ou seja, faça o SEO de sempre. As boas práticas não mudaram.
Se o seu site tem documentações, APIs e afins, você pode criar uma versão markdown, originada da mesma fonte da versão em HTML, e referenciar a URL dentro de um arquivo llms.txt.
Mas, para a maioria dos sites, como e-commerces, blogs, empresas B2B e publishers, não há razão para converter tudo em markdown. Não faz sentido se considerarmos a lógica dos crawlers e o possível futuro com os agentes de IA.
__
Se você quer melhorar o seu SEO, invista nas ações que realmente têm o potencial de levantar os seus números. E, para quem precisa de apoio profissional para identificar as melhores oportunidades, basta entrar em contato com a SEO Happy Hour!
Elyson Gums é redator na SEO Happy Hour. Trabalha com redação e produção de conteúdo para projetos de SEO e inbound marketing desde 2014, em segmentos B2C e B2B. É bacharel em Jornalismo (Univali/SC) e mestre em Comunicação Social (UFPR).
Comentários