A IA só gera tráfego quando ativa a pesquisa na web. Se não for possível gerar uma resposta apenas com seus dados de treinamento, ela busca fontes externas. E o seu site pode ser uma delas!
Mas, para isso, você precisa entender como essa pesquisa é feita e, principalmente, em quais situações ela acontece. Do contrário, você estará investindo na otimização de páginas que nunca serão consultadas.
Certos aspectos são iguais aos buscadores tradicionais, mas outros são completamente diferentes.
Entenda a seguir como as IAs pesquisam na web, com base em documentações vazadas, em uma entrevista com um porta-voz da Perplexity e na experiência da equipe da SEO Happy Hour.
Como funciona a busca na web das IAs?
As IAs pesquisam e processam conteúdo de forma diferente dos buscadores tradicionais. Elas consultam índices externos em tempo real – mas apenas quando o visitante pede ou quando precisa lidar com um prompt complexo ou sensível ao tempo.
Um resumo (bem resumido mesmo) do processo é:
- Sempre que possível, a IA gera uma resposta sem pesquisar nada;
- Se isso não for possível, ela consulta uma fonte externa (grounding);
- O prompt é transformado em diversas subpesquisas (query fan-out);
- Um conjunto de conteúdos são rastreados em tempo real;
- A IA extrai informações das URLs;
- Essas informações são resumidas e apresentadas na forma de uma resposta final, junto de links para os sites.
Em termos de SEO, é importante lembrar que sem pesquisa na web, você não tem tráfego atribuível à IA. Você pode ter visibilidade, caso a sua marca tenha peso dentro dos dados de treinamento da IA, mas não será possível calcular quantas pessoas realmente entram no seu site por causa disso.
Veja abaixo as etapas de como a IA pesquisa na web. E em seguida, quando ela pesquisa.
Grounding
Grounding significa conectar uma IA a um banco de dados externo. O objetivo geral é permitir consultas em tempo real, para que as respostas sejam melhores, mais completas e verdadeiras.
Sem isso, aumentam as chances de a IA inventar respostas. As chamadas alucinações ocorrem, dentre outras razões, por causa da falta de contexto. Ou seja, se a IA não sabe algo, ela tenta “deduzir”, gerando uma resposta semanticamente correta, mas mentirosa.
Nos principais chatbots de IA do mercado, o grounding é feito nos índices dos buscadores tradicionais, como Google e Bing.
Personalização
Não existe um “ranking” dentro das IAs. Elas não armazenam índices internamente, então não existe ser o top 1 para determinada palavra-chave no ChatGPT, Gemini ou Claude.
De acordo com Jesse Dwyer, porta-voz da Perplexity:
“Duas pessoas com a mesma consulta podem obter respostas diferentes em uma pesquisa comercial, se a ferramenta de IA que estão usando carregar a memória pessoal na janela de contexto (Perplexity, ChatGPT)”.
Apesar disso, o SEO influencia quais páginas são elegíveis para rastreamento. Durante o grounding, a IA tende a preferir páginas populares e relevantes para o prompt que está sendo pesquisado.
O que ocorre é que as fontes pesquisadas não são “fixas”, como é no Google, que tem um top 10 relativamente estável. Na IA, respostas e links podem ser diferentes para um mesmo prompt, de acordo com o contexto de cada conversa.
Processamento de documentos e subdocumentos
De acordo com Jesse Dwyer, há duas abordagens principais de processamento de conteúdo das páginas:
- Por documentos inteiros, com páginas sendo lidas como unidades completas;
- Por subdocumentos, quando fragmentos das páginas são processados individualmente.
Buscadores tradicionais indexam indexam documentos inteiros. Durante a pesquisa na web, muitas IAs funcionam da mesma forma:
Nas IAs, esse comportamento é repetido:
“Quando você usa uma ferramenta de IA construída nessa arquitetura (como a pesquisa na web do ChatGPT), ela basicamente realiza uma pesquisa clássica, pega 10 a 50 documentos principais e, em seguida, solicita ao LLM que gere um resumo. É por isso que a pesquisa GPT é descrita como ‘4 pesquisas no Bing em um sobretudo’ — a piada é direcionalmente precisa, porque o modelo está gerando uma saída com base em resultados de pesquisa padrão”.
Mas nem todas são assim. Alguns sistemas processam subdocumentos, extraindo “snippets” relevantes das URLs:
“O mecanismo processa trechos específicos e granulares. Um snippet, na linguagem da IA, tem cerca de 5 a 7 tokens, ou 2 a 4 palavras, convertido em números (pelo processo fundamental de IA conhecido como “transformador”, que é o T em GPT). Quando você consulta um sistema de subdocumentos, ele não recupera 50 documentos, mas cerca de 130.000 tokens dos trechos mais relevantes (cerca de 26 mil trechos) para alimentar a IA”.
Janela de contexto
Resumindo bastante, a janela de contexto é a quantidade de texto (tokens) que o modelo pode “lembrar” e referenciar em cada resposta.
Janelas maiores podem incorporar mais informações, responder prompts mais complexos e processar mais páginas (ou páginas maiores) ao mesmo tempo. Se as informações não couberem nessa janela, elementos precisam ser cortados ou resumidos.
A relevância disso para a pesquisa na web das IAs está na quantidade e na qualidade de tokens processados.
O objetivo é ocupar a janela de contexto com as melhores informações para responder um prompt. No caso do processamento por documentos, pelas melhores URLs. E no caso do processamento por subdocumentos, dos trechos mais relevantes.
A personalização também entra na janela de contexto. Nas palavras de Dwyer:
“O contexto pessoal que faz com que cada pesquisa não seja mais um resultado universal para todos os usuários é porque o LLM pode pegar tudo o que sabe sobre quem está pesquisando e usar isso para ajudar a preencher a janela de contexto completa. O que é muito mais informação do que um perfil de usuário do Google”.
Citações a sites
Os principais chatbots de IA indicam claramente quais URLs foram consultadas para a geração da resposta.
Pode ser por meio de um link clicável dentro da própria resposta, ou com um painel de links para explorar.
O que importa para SEO: se a resposta for escrita apenas com base nos dados de treinamento, nenhuma URL é mencionada. Apenas as marcas mais conhecidas são citadas por nome, mas sem links.
É por isso que ferramentas como o ChatGPT geram apenas cerca de 0.1% do tráfego total da web, mesmo sendo muito populares.
Quando as IAs pesquisam na web?
A maioria das IAs pesquisa pouco na web. Elas só fazem isso quando realmente não há outra forma de entregar uma boa resposta a um prompt.
Por exemplo, se você pergunta sobre as notícias do dia, ela logicamente precisa pesquisar e resumir o que está acontecendo no noticiário. O mesmo para a última partida do seu time de futebol.
Mas se pergunta sobre um conceito básico, como “qual a capital da França” ou “o que é SEO”, ela responde o que já sabe sobre o tema. São definições estáveis, que já estão contempladas nos dados de treinamento da IA.
As interfaces de IA do buscador do Google são as exceções. As AI Overviews e Modo IA sempre citam várias fontes, mesmo para prompts básicos. O Gemini não segue essa lógica.
No ano passado, vazaram supostos system prompts do Claude e do ChatGPT – Trata-se do conjunto de diretrizes do sistema, que inclui instruções de quando pesquisar na web.
Já fizemos a cobertura detalhada deles aqui no site da SEO Happy Hour:
Veja abaixo um resumo. Os detalhes podem ser diferentes para outras IAs, mas esse funcionamento é um bom ponto de partida para adaptar as suas estratégias.
Critérios de pesquisa
O system prompt do Claude detalha alguns critérios que ativam o recurso na web. Dependendo do prompt, a IA pode fazer a pesquisa automaticamente, sugerir para o visitante, ou pesquisar apenas quando ele pede.
Nunca pesquisa
Para certos prompts, o Claude nunca vai pesquisar na web. A resposta será gerada sem nenhum link.
Exemplo de prompt: “o que é SEO?”
Impacto em SEO: páginas que não agregam informações novas não são pesquisadas. Não tem porque a IA pesquisar algo que ela já sabe.
Sugere a pesquisa
Em alguns casos, o Claude pode responder, mas um dado novo torna a resposta mais satisfatória. Nesse caso, ele gera um texto e pergunta se o visitante quer uma pesquisa.
Exemplo: “qual é a população do Brasil?”. É um dado que o Claude já tem, mas pode mudar no decorrer do tempo, por isso ele sugere pesquisar.
Impacto em SEO: geralmente, são citadas apenas fontes de alta autoridade. Se você puder competir com esses portais, vale a pena apostar nesse tipo de pauta. Caso contrário, deve haver melhores opções para a sua visibilidade nas IAs.
Faz uma única pesquisa
Para prompts que envolvem dados factuais e atualizados, o Claude fará uma pesquisa simples. O objetivo é apenas validar a informação, sem necessidade de se aprofundar no tema.
Exemplo: “qual foi o último anúncio de jogo para o Nintendo Switch 2?”
Impacto em SEO: como no critério anterior, você até pode ter visibilidade para esse tipo de prompt, mas precisa ter muita autoridade no assunto do prompt.
Faz uma pesquisa detalhada
Para prompts detalhados, o Claude pode realizar várias pesquisas, consultando múltiplas fontes e sintetizando as principais informações em uma resposta final.
Exemplo: “faça uma análise comparativa detalhada entre [produto 1] e [produto 2], com informações de preços, características, benefícios e avaliações dos consumidores”.
Impacto em SEO: prompts desse tipo são as principais formas de sites terem visibilidade com IA. É impossível a IA gerar uma resposta confiável e atualizada sem consultar a web.
Prompts que ativam a pesquisa na web
No system prompt do ChatGPT, há uma classificação de tipos de prompt que ativam ou não a busca na web. É bem parecido com o Claude – prompts básicos são respondidos sem pesquisa, prompts complexos com consultas à web.
Informações em tempo real
Para esse tipo de prompt, o ChatGPT sempre pesquisa na web.
Exemplo: previsão do tempo ou resultados de futebol.
Impacto de SEO: seu site tem chances de aparecer, mas você precisará de muita autoridade. Geralmente o ChatGPT prefere bases de dados oficiais ou portais grandes para esse tipo de resposta.
Pesquisas locais
O ChatGPT pesquisa em diversas fontes e, muitas vezes, adiciona até cards de contato, como os do Google Maps.
Exemplo: restaurantes em Curitiba, Shows em São Paulo em junho.
Impacto em SEO: tem boas oportunidades de gerar tráfego para quem faz SEO local.
Assuntos complexos ou de nicho
O ChatGPT faz uma pesquisa complexa sobre o tema, para gerar uma resposta detalhada. Usa query fan-out, transformando cada pesquisa em cerca de cinco subpesquisas relacionadas, para cobrir o tópico com o máximo de detalhes.
Exemplo: “Monte uma linha do tempo histórica das dificuldades de monetização do jornalismo digital”.
Impacto em SEO: prompts desse tipo oferecem boas chances de visibilidade, pois muitos blogs e sites especializados são consultados aqui.
Assuntos sensíveis ao tempo
São informações que mudam com o passar do tempo. Sem a pesquisa em tempo real, a resposta do ChatGPT ficaria desatualizada ou incorreta.
Exemplo: “Calendário de jogos do Brasileirão” ou “quais os jogos mais recentes do Nintendo Switch 2”.
Impacto em SEO: você até pode aparecer como resposta nesse tipo de prompt, mas provavelmente as principais fontes serão sites de muita autoridade.
Como as IAs escolhem quais sites mencionar?
As IAs citam mais os sites de alta autoridade. Cada sistema tem as suas próprias preferências, mas costumam ser os domínios muito conhecidos, ou especializados em um tópico em particular.
Boas práticas de SEO influenciam quais sites são elegíveis. Quando o site é tecnicamente estável, as páginas são fáceis de entender para as máquinas, e estão no topo dos buscadores tradicionais, é mais simples para a IA extrair informações dali.
Logo, aumentam as chances de você receber citações.
Kevin Indig, especialista em SEO dos EUA, considera que construir uma marca relevante é o melhor caminho para receber citações. Em sua visão, essa visibilidade é construída por:
- Representação adequada de entidades e atributos;
- Tempo de resposta do servidor em menos de 200 ms;
- Otimização de metadados;
- Feeds de produtos atualizados (para e-commerces);
- Estruturação adequada de conteúdo (com heading tags, listas, tabelas, etc.);
- Páginas de FAQ, quando relevante;
- Conteúdo atualizado nos últimos 12 meses;
- Menções externas à marca, para validar a autoridade;
- Posição no SEO tradicional
- Demonstrações consistentes de expertise e autoridade nas páginas;
- Presença de UGC (conteúdo gerado por usuário).
Outras pesquisas sobre estratégias para aparecer na IA indicam caminhos parecidos.
Como isso influencia o seu SEO?
Você deve adaptar a sua estratégia de conteúdo para a IA. O conteúdo raso será cada vez mais punido. Nos buscadores tradicionais, perderá espaço para os resumos de IA. E na lógica dos chatbots, não gera tráfego.
Ao otimizar o seu site, lembre-se sempre do seguinte:
- As boas práticas gerais de SEo continuam válidas;
- Certos tipos de prompt nunca vão gerar tráfego atribuído a IA;
- Para aparecer, você precisa gerar autoridade tópica e construir relevância de marca;
- Se você quer receber menções, suas páginas devem cobrir alguma lacuna nos dados da IA. Ou seja, entregar algo que ela ainda não sabe e não pode resumir por conta própria.
Conseguimos perceber esses elementos claramente no gráfico dos clientes aqui da SHH.
Quem publica conteúdo genérico tem resultados piores.
Se apoiar naquele conteúdo que é só “mais do mesmo” é bem perigoso no longo prazo. O mesmo vale para quem usa IA pra gerar um rascunho e depois só reescreve com outras palavras.
Essas práticas perdem força porque as LLMs não precisa consultar nenhum site para gerar esse tipo de informação. São fatos que ela já sabe. Os buscadores tradicionais, cada vez mais integrados à IA, estão seguindo a mesma lógica.
Se você precisa de apoio para lidar com esse cenário, entre em contato com a SEO Happy Hour. Nossa consultoria está guiando empresas nacionais e internacionais por esse cenário tão complexo.
Comentários