Ao responder um prompt, o ChatGPT pode citar páginas que não existem. Outras LLMs têm comportamento parecido, mas não fazem tanto quanto a plataforma da OpenAI.
Possivelmente, ocorre por causa das alucinações, que são comuns às LLMs. E também porque elas não armazenam URLs em formato de índice, como fazem os buscadores.
Um caso que ganhou notoriedade foi relatado por Anastasia Kotsiubynska, head de SEO da plataforma SE Ranking. Ela analisou as páginas que recebiam tráfego vindo do ChatGPT e reparou que muitas URLs sequer existiam.
Alguns meses depois, em setembro de 2025, uma pesquisa da Ahrefs descobriu que todas as IAs têm o mesmo pensamento. De acordo com os dados, cerca de 1% dos links citados pela IA não existem.
Para descobrir se está acontecendo no seu site, acesse o Google Analytics e verifique se as URLs que estão recebendo tráfego existem de verdade. Caso não existam, você pode fazer redirecionamentos ou aproveitá-las na sua estratégia de conteúdo.
Entenda abaixo por que acontece e como lidar com a situação.
O que são as alucinações das Inteligências Artificiais?
Uma alucinação é quando uma IA inventa uma informação que parece verdadeira. Ela fala com confiança, mas a resposta não corresponde aos dados de treinamento.
Provavelmente até já aconteceu com você. No início do ChatGPT, não havia dados de treinamento sobre eventos recentes. Por isso, se você perguntasse sobre temas mais atuais, as respostas pareciam fazer sentido, mas não tinham base na realidade.
As alucinações podem acontecer por várias razões:
Dados de treinamento insuficientes;
Suposições feitas com base nos dados disponíveis;
Vieses durante o treinamento do modelo.
O problema ocorre de forma geral nos Modelos de Linguagem de Larga Escala (LLMs). No ChatGPT, era mais comum encontrá-lo em textos, especialmente entre 2022 e 2023.
Agora, ocorreu também em links. Provavelmente a razão foi a mesma: havia uma “lacuna” na hora de pesquisar na internet, que o ChatGPT tentou cobrir fazendo suposições sobre o que seria um formato adequado de link.
As alucinações nos links da SE Ranking
O ChatGPT estava indicando páginas que não existem como fontes nas respostas de IA. Eram URLs que simplesmente não existiam, ou que eram parecidas com conteúdo que de fato estava no site.
No total, foram 70 URLs “inventadas”. A maioria tinha duas ou três acessos, mas algumas chegaram a mais de 20 sessões.
Nos comentários do post original do LinkedIn, outras pessoas relataram ter visto as alucinações ao gerar links. Por enquanto, não há estudos que indiquem algum padrão de comportamento que as desencadeie.
Como lidar com as alucinações de URL?
Anastasia seguiu este plano de ação para lidar com as URLs inventadas:
Criou novas páginas com base no relatório. Algumas páginas que não existem poderiam ser criadas e, se estavam sendo citadas pela LLM, talvez tenham potencial de agradar os visitantes;
Não fez nada nas URLs que têm apenas 1 acesso.
Essas ações servem especialmente para “corrigir” a jornada de quem acessa o site vindo do ChatGPT.
Nos comentários do post original, o CMO Mo Rassam deu uma sugestão de mensagem para a página 404. O texto diz: Algum assistente de IA te mandou pra cá? ChatGPT, Perplexity e outros assistentes de IA às vezes sugerem URLs que não existem. Não se preocupe – acontece com todo mundo! Vamos te mandar para o lugar certo.
Um arquivo llm.txt resolveria o problema?
O llm.txt é um arquivo que explica às LLMs quais partes de um site devem ser acessadas, rastreadas e indexadas. Seria igual ao robots.txt, usado para instruir os rastreadores dos mecanismos de busca tradicionais.
Em teoria, se você listar todas as URLs e sessões que a LLM pode acessar, não teria por que inventar nada. Mas, na prática, não há indícios de que esse arquivo seja lido ou respeitado.
Isso tem muito a ver com a “estrutura” usada pelas LLMs. Elas navegam pela internet da mesma forma que os mecanismos de busca tradicionais, usando crawlers. São robôs que acessam as páginas para que elas possam ser indexadas.
Os crawlers de IA rastreiam muito conteúdo 404
Além de “inventar” links, o ChatGPT gasta recursos com páginas indisponíveis. São aquelas URLs que já existiram no site, mas saíram do ar, ou tiveram conteúdo movido para outro lugar.
Essa ineficiência dos crawlers de IA foi documentada pela Vercel com base em uma pesquisa de bilhões de rastreios. A OpenAI está entre as piores: 34% das requisições são para páginas 404, outras 14,36% seguem cadeias de redirecionamento.
A maioria das plataformas de LLM do mercado segue esse padrão. Uma das exceções é o Google, que gasta poucos recursos com URLs inválidas.
Não fica claro se essa característica do robô influencia na alucinação de links, mas é uma informação interessante para entender que as LLMs não são “otimizadas” para entender o conceito de URL válida (que retorna status 200).
As alucinações de links em números
A Ahrefs descobriu menções a links que não existem também.
Diante disso, estudaram o padrão de menções “inventadas”, analisando cerca de 16 milhões de URLs citadas pelas principais ferramentas de IA do mercado.
Considerando links que são clicados, as principais descobertas foram:
Todas as IAs analisadas inventam links;
O ChatGPT é quem mais inventa;
O Mistral, uma IA francesa, é quem inventa menos;
Praticamente todas alucinam mais que o Google, que tem apenas 0,15% de taxa de links 404 indexados.
Na sequência, eles fizeram o mesmo teste em sua ferramenta interna de visibilidade em LLMs, o Brand Radar. Ali, os números foram muito mais altos:
Vale lembrar que o Brand Radar é uma base de dados de prompts. Ou seja, é uma “simulação” de como as LLMs funcionam, então os dados servem apenas como uma referência e aproximação, que não necessariamente refletem como as IAs se comportam de verdade.
Ao realizar estas análises, a Ahrefs percebeu outro dado, muito interessante: algumas URLs parecem já ter existido no passado, mas hoje retornam status 404 (conteúdo não encontrado). Portanto, ao menos parte das alucinações pode ser causada porque a IA estava referenciando um conhecimento que ela já tinha, mas que ficou ultrapassado.
De todo modo, o resultado prático é o mesmo: o visitante vê a resposta da IA, clica e vê uma página que não existe.
Elyson Gums é redator na SEO Happy Hour. Trabalha com redação e produção de conteúdo para projetos de SEO e inbound marketing desde 2014, em segmentos B2C e B2B. É bacharel em Jornalismo (Univali/SC) e mestre em Comunicação Social (UFPR).
Comentários