O BlockRank é um método para tornar as IAs mais eficientes na classificação de páginas. Ela permite que modelos entendam e ranqueiem páginas com mais rapidez, sem perdas de precisão.
Sem o BlockRank, esse processo era caro e impossível de aplicar em escala.
A base desse funcionamento está no ranqueamento contextual (ICR), na qual IAs processam múltiplos documentos (páginas da web) de forma simultânea, para entender quais são os mais relevantes.
O BlockRank foi anunciado em outubro de 2025, em um artigo do Google DeepMind chamado Scalable In-Context Ranking with Generative Models. Por enquanto, não está em uso nos produtos Google.
Entenda abaixo como funciona – e por que ele é considerado uma inovação técnica com grande potencial.
O que é o BlockRank?
O BlockRank é uma técnica que permite que IAs leiam uma pesquisa e múltiplas URLs ao mesmo tempo para entender quais exibir ao visitante, concentrando-se apenas nos trechos mais importantes de cada página.
Esse processo é puramente semântico. Ou seja, vai além das palavras que compõem as pesquisas e os documentos.
Para que uma IA consiga fazer isso, ela compara diversos documentos entre si para entender qual tem maior probabilidade de solucionar a pesquisa.
Quanto mais textos são comparados, mais cara e lenta a análise se torna.
O BlockRank usa uma abordagem diferente. Pesquisadores do Google entenderam alguns detalhes sobre as LLMs e as modificaram, para escalar o processo sem aumentar tanto os custos computacionais.
Antes de entender tudo isso, é necessário conhecer os conceitos de ICR e de atenção nas IAs.
Ranqueamento contextual (ICR)
In-Context Ranking, ou Ranqueamento Contextual, é uma abordagem que usa IAs para classificar páginas em listas.
Por meio do ICR, a IA avalia a semântica (significado das palavras) para entender quais são os melhores “matches” para cada pesquisa.
É um processo relativamente novo, descrito pela primeira vez em 2024 por pesquisadores do Google. Os resultados preliminares mostraram que o ICR pode ser tão eficaz quanto outros sistemas de classificação de páginas.
Ele depende de três elementos:
- Um prompt claro, como “ranqueie essas páginas”;
- Uma lista de candidatos, que são os documentos (URLs) que devem ser ranqueados;
- A consulta/pesquisa que a pessoa está realizando.
A partir daí, a LLM consegue “raciocinar” e gerar uma lista com os documentos mais relevantes no topo.
O conceito de atenção nas LLMs
“Atenção” é o mecanismo que permite às LLMs focar nas partes mais relevantes de um texto. O modelo atribui “pesos” a palavras, com base na relação dessas palavras com as demais que está processando.
Esse mecanismo está na infraestrutura das IAs e é um dos responsáveis pela sua capacidade de entender contexto, significados, lidar com ambiguidade e gerar respostas coerentes.
Resumindo bastante, a “atenção” ajuda a IA a decidir onde se concentrar na hora de processar informação.
O BlockRank foi projetado com base em duas observações dos pesquisadores do Google:
- Os modelos tendem a analisar cada documento (URL ou página) separadamente, sem compará-lo com os demais;
- Certas palavras presentes na pesquisa dão pistas sobre quais tipos de documento são mais relevantes.
Aproveitando-se dessas características, os pesquisadores modificaram os modelos para minimizar processamento desnecessário.
Como o BlockRank funciona?
A eficiência do BlockRank resulta do método de comparação de documentos e de pesquisas.
Escassez de blocos
O primeiro aspecto técnico é a escassez de blocos entre documentos (inter-document block sparsity, em inglês).
Em sistemas convencionais de ICR, o modelo processa documentos em conjunto. Já o BlockRank faz o contrário: analisa individualmente os documentos e os compara apenas à pesquisa principal.
Sem comparações desnecessárias entre documentos, a IA consegue ler mais rápido e entender da mesma forma que antes.
Relevância entre consultas e documentos
O segundo aspecto técnico é a relevância entre blocos de consulta e documentos (query-document block relevance, em inglês).
Durante o ICR, pesquisadores perceberam que o modelo não atribui o mesmo peso a todas as palavras da pesquisa. Alguns elementos, como termos específicos, pontuações ou construções gramaticais, permitem identificar quais documentos merecem mais atenção.
Com base nisso, eles treinaram o modelo para reforçar a associação entre as palavras da consulta e os blocos de documentos mais pertinentes. Isso se chama objetivo de treinamento contrastivo.
É como se o modelo lesse os textos, sublinhasse as partes mais importantes e comparasse apenas essas partes à pesquisa original.
O diferencial do BlockRank
A principal contribuição do BlockRank é realizar o ICR com mais rapidez e economia.
Entre os principais resultados detalhados no artigo, o método:
- Rodou cerca de 4,7 vezes mais rápido do que modelos tradicionais, ao ranquear 100 documentos;
- Escalou para 500 documentos em cerca de um segundo;
- Alcançou o mesmo desempenho ou superou outros sistemas de ranqueamento que usam IA.
Os testes específicos foram:
- BEIR: coleção de perguntas para testar a habilidade de um sistema de encontrar informação relevante sobre vários assuntos diferentes;
- MS Marco: um banco de dados de pesquisas reais do Bing, usadas para medir a habilidade de um sistema para responder perguntas diretas;
- Natural Questions (NQ): um banco de dados de pesquisas reais do Google, para testar se um modelo consegue identificar e ranquear passagens da Wikipedia.
Qual é o impacto do RankBlock?
Para os pesquisadores, o principal impacto é facilitar o acesso a sistemas complexos de ranqueamento de páginas:
[O BlockRank] torna a recuperação semântica avançada mais viável computacionalmente e pode democratizar o acesso a ferramentas poderosas de descoberta de informação. Isso pode acelerar pesquisas e melhorar soluções educacionais, ao oferecer informação mais relevante com rapidez, o que empodera indivíduos e organizações com melhores capacidades de tomada de decisão.
Essa economia de recursos computacionais tem vários efeitos, incluindo menor consumo de energia e maior liberdade para empresas com recursos financeiros limitados.
O BlockRank em breve estará no Github, para que possa ser usado em assistentes de IA que lidam com muitos documentos ou em interfaces de IA que realizam grounding e dependem de latência e de escalabilidade.
Por enquanto, a técnica foi testada apenas com o modelo Mistral-7B. Futuramente, outros modelos devem ser usados, inclusive os da família Gemini, que são usados em todas as interfaces do Google.
Até aqui não sabemos nada sobre a implementação prática em Pesquisa, Gemini, AI Overviews ou Modo IA.
Quando isso acontecer, em teoria, a qualidade das respostas aumenta. E, como consequência, conteúdo alinhado à intenção de busca tende a gerar melhores resultados. Afinal, é um sistema mais moderno e sofisticado para estabelecer relações entre pesquisas e páginas da web.
No entanto, são apenas hipóteses, que só serão confirmadas quando o Google de fato passar a usar o BlockRank em seus produtos.
Preciso otimizar textos para o BlockRank?
Não é correto pensar em “otimizar para o BlockRank”.
Primeiro, porque não sabemos como será a implementação nos produtos Google. E depois, porque as boas práticas para serem lidas por uma IA continuam as mesmas: criar páginas claras, com estrutura coesa e alinhadas à intenção de busca.
Outro detalhe é que sistemas como o BlockRank não dependem de palavras-chave. Eles são semânticos e consideram apenas o significado dos termos.
Se você já leva tudo isso em consideração ao produzir conteúdo, então está tudo certo, mesmo que os sistemas do Google mudem.
__
Você já tinha ouvido falar no BlockRank? Por aqui, estamos acompanhando esta e outras atualizações do Google de perto! Para não perder, no LinkedIn e leia nossa newsletter!
Comentários