Documentação vazada revela como o ChatGPT pesquisa na web

O ChatGPT pesquisa na web apenas em situações muito específicas. Por isso, sites têm visibilidade apenas quando cobrem algum assunto que foge aos dados de treinamento da LLM.

As informações estão em um system prompt vazado no início desta semana. Profissionais de SEO no mercado internacional estão atentos, pois as novidades têm muitas implicações para as estratégias técnicas e editoriais dos sites. 

Estas são as situações em que o ChatGPT pesquisa na web:

  • Para encontrar informações “em tempo real”, ou que precisam ser atualizadas;
  • Em pesquisas locais; 
  • Para pesquisas complexas, impossíveis de responder apenas com o banco de dados da LLM.

Neste processo, até cinco pesquisas podem ser realizadas, em múltiplos idiomas.

O vazamento foi divulgado pelo portal alemão GPT Insights. No início de junho, ele fez a cobertura de um caso semelhante, do “leak” do System Prompt do Claude.

A documentação vazada do ChatGPT

O documento vazado foi o System Prompt do ChatGPT. É uma lista detalhada de instruções, aplicada automaticamente em todas as conversas do ChatGPT. Ali ficam especificadas quais ferramentas internas a LLM usa, como a Busca na Web, ou Modo Investigação, de acordo com cada prompt. 

James Berry, criador de uma plataforma para análise de visibilidade em LLMs, foi o autor do vazamento. São 16 páginas de texto, com diversas diretrizes, incluindo sobre pesquisa na web.

Importante: não há como confirmar a veracidade do documento. A OpenAI não comentou nada a respeito e a mídia não fez uma cobertura tão extensa sobre o caso. Apesar disso, trouxemos a análise para o site da SEO Happy Hour por duas razões:

  • Os dados se alinham aos movimentos de mercado que estamos observando, refletem as informações públicas sobre o ChatGPT, e são facilmente verificáveis na própria LLM;
  • Nomes relevantes da indústria de SEO estão repercutindo a notícia.

Quando o ChatGPT pesquisa na web?

O recurso de pesquisa na web é altamente limitado no ChatGPT, assim como em outras LLMs. A ativação acontece apenas quando é absolutamente essencial pesquisar em fontes externas, ou quando a pessoa pede explicitamente no prompt.

As instruções são:

Use a ferramenta de pesquisa na web para acessar informação atualizada na internet ou quando responder ao usuário requer informação sobre a sua localização.

Evite usar a ferramenta de pesquisa na web para informação sabidamente disponível internamente, a menos que o usuário explicitamente indique preferência por fontes públicas.

Alguns exemplos:

  • Informações em tempo real: “previsão do tempo hoje”, “placar jogos do Brasileirão”;
  • Pesquisas locais: “melhores restaurantes em Curitiba”, “shows em Curitiba em junho”;
  • Assuntos complexos ou de nicho: “linha do tempo histórica das dificuldades de monetização do jornalismo digital”;
  • Situações onde informações antigas geram resultados errados: “calendário de jogos do Brasileirão e onde assistir”, “novos jogos anunciados para o Switch 2”.

Como funciona a pesquisa na web do ChatGPT?

Nas situações em que o ChatGPT pesquisa na web, há instruções técnicas bem específicas para encontrar os resultados. 

São elas:

  • Ramificação de pesquisas, onde o ChatGPT gera até cinco pesquisas diferentes para responder cada prompt;
  • Termos-chave principais são marcados com um “+” e recebem prioridade nas buscas;
  • Existe um parâmetro para “frescor de conteúdo”, com pontuação de 0 a 5, que vai de “fato imutável” até “sensível ao tempo”, onde fontes atualizadas nos últimos 30 dias são prioridade;
  • As pesquisas são multi-idioma – o ChatGPT pode pesquisar em inglês, mesmo se este não for o idioma do prompt.

Vale a pena ver algumas dessas diretrizes no detalhe.

A ramificação de pesquisas foi recentemente anunciada pela própria OpenAI. As subpesquisas não ficam disponíveis na interface da LLM, mas é possível descobrir quais são usando o Chrome Dev Tools (menu de “inspecionar” páginas). Veja como se faz:

O Google tem um recurso semelhante no Modo IA, chamado query fan-out. Presumivelmente outras LLMs funcionam de forma similar.

“Frescor de conteúdo” também é uma métrica avaliada pelo Google. Desde 2011 o buscador consegue identificar quais tipos de pesquisa necessitam de informações atualizadas.

As fnformações em tempo real estão entre as principais “barreiras” para as LLMs. O recurso de pesquisa na web é uma forma de contorná-la. Mesmo no Google, um buscador muito mais robusto do que o ChatGPT, notícias ainda estão entre os conteúdos que menos ativam as AI Overviews em 2025.

Visibilidade de sites no ChatGPT

O ChatGPT faz link para sites apenas se o recurso de Pesquisa na Web for ativado. Isso sugere que não há um “índice” com URLs armazenadas para acesso rápido. 

Sempre que o ChatGPT faz uma menção, significa que ele pesquisou aquela página em tempo real em um índice externo (o Bing).

É bem diferente dos mecanismos de busca padrão, como o Google. Neste caso, as URLs rastreadas ficam armazenadas e são consultadas para cada pesquisa. Gary Illyes, engenheiro da big tech, já explicou como funciona.

Aqui, temos mais um indício de que SEO é fundamental para visibilidade em LLMs. Se você não aparece no Bing na hora em que o ChatGPT está pesquisando na web, dificilmente será citado como fonte (e terá menos tráfego). 

Alucinação em URLs

O System Prompt não traz nenhum detalhe sobre as alucinações em links do ChatGPT. Mas, a ausência de um índice interno pode explicá-las.

Especialistas de SEO descobriram que o ChatGPT “inventa” links para o seu site. Ele recomenda artigos que literalmente não existem. Quando as pessoas clicam, são levadas até uma página 404.

tabela com URLs do site do SE Ranking inventados pelo ChatGPT

Como o ChatGPT não tem um índice interno, ele só sabe que uma página existe quando ativa a ferramenta de pesquisa na web. Se não faz isso, ele precisa “prever” a estrutura da URL, com base no prompt digitado e em seus dados de treinamento.

Para evitar esse tipo de erro, a LLM dificilmente inclui links nas respostas. Se você pedir, o padrão será pesquisar resultados atualizados. Se por alguma razão o ChatGPT citar uma URL sem pesquisar na web, provavelmente será uma homepage.

Com links mais curtos, há menos chances de erro do que com as URLs mais longas e específicas. 

As recomendações de SEO

Resumindo tudo o que vazou: o ChatGPT só pesquisa na web quando estritamente necessário. 

Isso tem várias implicações para quem usa SEO como um canal de marketing. Primeiro, significa que a visibilidade em IA depende inteiramente das pesquisas em tempo real. E, como o recurso é ativado pouco, a LLM gera menos tráfego do que os mecanismos de busca tradicional.

No mais, se um tema já faz parte dos dados de treinamento da IA, dificilmente vai gerar tráfego para os sites.

Algumas estratégias para lidar com esse cenário são:

  • Coberturas de eventos em tempo real podem ser uma estratégia viável para obter mais tráfego (grandes marcas já estão investindo nisso);
  • Mudança de estratégia editorial, para focar em coberturas especializadas e pautas mais específicas, em vez do conteúdo de topo de funil, que é facilmente “resumível” pelas LLMs;
  • Atualize seus conteúdos com frequência, pensando nas métricas de “frescor” do ChatGPT;
  • Monitore palavras-chave altamente específicas e termos de cauda longa, mesmo que não tenham alto volume de busca mensal. Prompts que exigem informações mais complexas e aprofundadas têm mais chance de receber citações da IA.

Publicamos diversos guias sobre como as IAs funcionam aqui no site da SEO Happy Hour. Aprender como o ChatGPT e outras LLMs leem, interpretam e buscam conteúdo com certeza te ajudará a receber mais citações. Veja:

Também estamos reunindo pesquisas atualizadas sobre as AI Overviews do Google, uma das principais responsáveis por quedas de tráfego orgânico de sites. 

__

Se você quer um site com mais visibilidade, podemos ajudar. Entre em contato com a SEO Happy Hour e conheça nossos serviços de otimização para mecanismos de busca (incluindo LLMs).

  • Elyson Gums

    Elyson Gums

    Elyson Gums é redator na SEO Happy Hour. Trabalha com redação e produção de conteúdo para projetos de SEO e inbound marketing desde 2014, em segmentos B2C e B2B. É bacharel em Jornalismo (Univali/SC) e mestre em Comunicação Social (UFPR).

Comentários

0 Comentários

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *