Vaza suposto system prompt do GPT-5, com detalhes sobre busca na web

O modelo GPT-5 da OpenAI foi lançado em agosto e o seu system prompt já foi divulgado. Trata-se de um documento com as diretrizes gerais da LLM, que guia as respostas para todos os prompts.

Para SEO, o que mais interessa são as regras para ativar o recurso “busca na web”. O ChatGPT só gera citações (e possivelmente tráfego) para os sites se ele estiver ativo.

Em resumo, o recurso é usado em prompts que envolvem: 

  • Pesquisas locais;
  • Informações novas; 
  • Conteúdo de nicho;
  • Temas sensíveis.

Fora destas situações, o visitante precisará ativar o recurso manualmente para que o ChatGPT pesquise na web. Nos modelos anteriores, já acontecia desta forma. 

Veja abaixo os detalhes e seus possíveis impactos para SEO.

A documentação vazada do GPT-5

O hacker Pliny apresentou o texto completo do system prompt do GPT-5 no dia 7 de agosto. Ele é especialista em jailbreak, que significa contornar as diretrizes de uma LLM para que ela responda sobre temas que normalmente são proibidos.

Usando a técnica, ele extraiu o system prompt do novo modelo, assim como já fez com o Claude no início do ano.

É um texto enorme, que guia as respostas do ChatGPT, incluindo detalhes sobre personalidade, estilo de resposta, temas proibidos e ativação de ferramentas.

https://twitter.com/elder_plinius/status/1953583554287562823

Importante: não há confirmação externa de que este system prompt é oficial. Portanto, não mude totalmente a sua estratégia de SEO com base nessas informações, nem confie cegamente nelas.

Estamos cobrindo o tema porque as diretrizes para busca na web, que interessam a SEO, se alinham a outros estudos e observações sobre as IAs.

A busca na web no ChatGPT

O GPT-5 pesquisa na web apenas quando isso é estritamente necessário. 

Se não for possível responder algo com os dados internos, ele pesquisa em fontes externas. Este processo se chama grounding e, ao que tudo indica, o novo modelo depende mais dele para gerar respostas de alta qualidade.

A pesquisa na web do ChatGPT funciona por meio de uma ferramenta interna chamada “web”, que tem dois comandos:

  • search(): pesquisa em índices de buscadores;
  • open_url: acessa uma página e rastreia seu conteúdo.

Sobre a ativação do recurso, o system prompt indica:

Usar a ferramenta “web” para acessar informação atualizada da web, ou quando a resposta ao usuário requer informação sobre a sua localização. 

https://twitter.com/elder_plinius/status/1953583557097795831

Os critérios para ativar a busca na web

O recurso de busca na web é ativado automaticamente para pesquisas locais, informações novas, muito específicas ou que exigem alta precisão.

A tradução do system prompt indica os seguintes detalhes:

Informação local: use a ferramenta ‘web’ para responder a perguntas que necessitam de informação sobre a localização da pessoa, como sobre o tempo, negócios locais ou eventos.

Frescor: se informação atualizada sobre algum assunto pode mudar ou melhorar a resposta, use a ferramenta ‘web’ em casos onde você se recusaria a responder a pergunta porque o seu conhecimento poderia estar desatualizado.

Informação de nicho: se a resposta se beneficiaria de informação detalhada não amplamente conhecida ou compreendida (que pode ser encontrada na internet), como detalhes sobre um pequeno bairro, uma empresa desconhecida, ou regras difíceis de compreender, use fontes da web em vez de conhecimento obtido em pré-treinamento. 

Precisão: se o custo de um erro ou informação desatualizada for alto (por exemplo, usar uma versão desatualizada de uma biblioteca de software ou não saber a data do próximo jogo de alguma equipe esportiva), então use a ferramenta ‘web’.

O ranking de frescor de informação

Um dado interessante, do ponto de vista de SEO, é a preferência do ChatGPT por páginas atualizadas. Ele conta, inclusive, com um sistema chamado “query deserves freshness”, ou “pesquisa precisa de frescor”, para definir a preferência por fontes com informações mais novas. 

É uma classificação que vai de 0 a 5. Segundo o system prompt:

0: fato histórico/não importa ser atualizado.

1: nos últimos 18 meses.

2: nos últimos 6 meses.

3: nos últimos 90 dias.

4: nos últimos 60 dias.

5: conteúdo deste mês.

Para cada prompt, o ChatGPT indica um número. Por exemplo:

  • Qual é o placar do jogo do Vasco agora? ‘search()’ com QDF=5;
  • Qual é a data do próximo eclipse solar? ‘search()’ com QDF=2.

O Google também trabalha com classificações de frescor de informação desde pelo menos 2011. No ChatGPT, também já existia em modelos anteriores. 

Diretrizes para temas sensíveis

Outro detalhe do system prompt é uma política específica para pesquisas sobre temas sensíveis

O texto explica:

Lembrete de política: quando usar resultados da web por temas sensíveis ou muito importantes (como conselhos financeiros, informações sobre saúde, questões jurídicas) sempre analise cuidadosamente múltiplas fontes de alta reputação e apresente as informações com citações e advertências claras.

É basicamente o conceito de conteúdo YMYL do Google. A sigla significa “Your Money, Your Life”, ou “Seu dinheiro, Sua Vida” e envolve todos os temas que merecem uma avaliação de qualidade mais cuidadosa, pois informações falsas podem causar danos sérios.

O que isso significa para a sua estratégia de SEO

Com base nas informações deste system prompt, podemos entender o seguinte:

  • Atualizar as suas páginas com frequência pode aumentar as suas citações no ChatGPT, já que para muitos prompts ele prioriza conteúdos recentes;
  • Vale a pena investir em SEO local, caso isso tenha relevância para os serviços que você oferece;
  • Informações específicas, que provavelmente não estão nos dados de treinamento da IA, representam oportunidades de citação;
  • Construir autoridade importa bastante, principalmente para temas delicados.

No mais, lembre-se sempre de que informações genéricas já estão na base de treinamento da IA. Logo, eles não geram citações para o seu site. Daí a importância de criar conteúdo rico, atualizado e tecnicamente otimizado.

__

Para acompanhar todas as novidades sobre o ChatGPT e as demais IAs do mercado, siga-nos no LinkedIn, no YouTube e inscreva-se na nossa newsletter!

  • Elyson Gums

    Elyson Gums

    Elyson Gums é redator na SEO Happy Hour. Trabalha com redação e produção de conteúdo para projetos de SEO e inbound marketing desde 2014, em segmentos B2C e B2B. É bacharel em Jornalismo (Univali/SC) e mestre em Comunicação Social (UFPR).

Comentários

0 Comentários

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *