Neste artigo: Como este tema funciona na sua empresa Paper GEO de Princeton Por que este paper importa para marketing Quem fez, onde foi publicado, por que credibilidade GEO-bench: o que é e como foi montado Os 9 métodos testados, um a um Conclusões principais do paper O que o paper não diz (e como o mercado o estendeu) Como adaptar ao português brasileiro Implicações para o calendário editorial Erros comuns ao aplicar o paper Sinais de que sua operação de conteúdo ainda não internalizou o paper Caminhos para aplicar o paper na operação Quantos dos 9 métodos GEO estão no checklist de revisão editorial do seu time? Perguntas frequentes O que diz o paper GEO de Princeton? Quais são os 9 métodos GEO testados? Citações aumentam visibilidade em LLM? Estatísticas no conteúdo ajudam GEO? Que método GEO funciona melhor? O paper GEO foi publicado em qual evento? Fontes e referências

oHub Base MKT Conteúdo, SEO e Inbound › GEO e Visibilidade em IA

O paper GEO de Princeton: os 9 métodos validados

Pesquisa que fundamentou a disciplina

Atualizado em: 07 de julho de 2026 • Apresentar o paper GEO (Princeton/KDD 2024), os 9 métodos testados e quais funcionam melhor.

Este conteúdo foi gerado por IA e pode conter erros. |

Como este tema funciona na sua empresa

Pequena empresa

O paper de Princeton vira leitura aplicada — não acadêmica. A equipe de marketing (frequentemente uma só pessoa) lê o resumo, identifica os dois ou três métodos com maior ganho médio (citação de fontes, dados estatísticos, citações diretas) e aplica nos conteúdos pilar. Investimento principal é tempo de revisão editorial; sem orçamento para experimentação própria, a empresa adota como receita validada por terceiros. Resultado típico: melhor citabilidade em mecanismos generativos com poucas horas de ajuste por artigo.

Média empresa

Equipe de conteúdo internaliza os 9 métodos como checklist editorial. Cada artigo novo passa por revisão que verifica presença de citações com URLs, dados quantitativos, citações de autoridade, fluência, terminologia técnica adequada. Revisão de conteúdo legado prioriza artigos pilar. Em paralelo, monitoramento de citação em ChatGPT, Perplexity e Gemini começa a virar indicador acompanhado. Investimento mensal entre R$ 5.000 e R$ 20.000 em ferramentas e capacitação.

Grande empresa

Empresa replica o GEO-bench no próprio domínio: identifica queries relevantes para o negócio, monitora visibilidade em múltiplos LLMs antes e depois de ajustes editoriais, calcula efeitos médios em escala. Equipe de SEO/GEO dedicada, integração com plataformas como Profound, Athena HQ ou Otterly.AI. Operação alinhada com paper original mas com adaptações domésticas validadas por experimentação interna. Investimento anual acima de R$ 250.000 entre ferramentas, equipe e capacitação.

Paper GEO de Princeton

é a pesquisa "GEO: Generative Engine Optimization" publicada em 2024 por Aggarwal, Murthy, Hashemi, Swayamdipta, Yang e Narasimhan (Princeton University), apresentada na conferência KDD 2024, que estabeleceu pela primeira vez fundamento empírico para o campo de otimização de conteúdo para mecanismos generativos, testando 9 métodos de reescrita em 10.000 queries de 8 domínios através do benchmark GEO-bench e medindo o impacto de cada método na visibilidade do conteúdo dentro de respostas de modelos de linguagem.

Por que este paper importa para marketing

GEO (Generative Engine Optimization, otimização para mecanismos generativos) virou termo onipresente em conferências de marketing a partir de 2024. Como tantas disciplinas emergentes em marketing, vem cercada de opinião sem evidência: cada agência defende seus métodos, cada blogueiro especialista vende sua receita.

O paper de Princeton mudou esse cenário. Pela primeira vez, há evidência empírica controlada sobre o que efetivamente aumenta visibilidade em respostas de modelos de linguagem. Não é receita; é metodologia, dados e conclusões verificáveis. Marketing baseado em evidência ganhou o primeiro grande artefato no campo de GEO.

Este artigo destrincha quem fez, como fez, o que testou, o que funcionou e o que não funcionou — e como adaptar as conclusões ao mercado brasileiro. Funciona como referência primária para qualquer time que adote GEO seriamente.

Quem fez, onde foi publicado, por que credibilidade

O paper foi assinado por Pranjal Aggarwal, Vishvak Murthy, Vatsal Hashemi, Swabha Swayamdipta, Yiming Yang e Karthik Narasimhan. A liderança intelectual vem de Karthik Narasimhan, professor associado de Ciência da Computação em Princeton com pesquisa em processamento de linguagem natural e aprendizado por reforço. Os outros autores incluem pesquisadores de IBM e Georgia Tech.

Publicação em duas frentes: arXiv (preprint, identificador 2311.09735) em novembro de 2023, com revisões posteriores; e apresentação nos anais do KDD 2024 (ACM SIGKDD International Conference on Knowledge Discovery and Data Mining), uma das principais conferências da área de descoberta de conhecimento e ciência de dados.

A combinação dá credibilidade alta: instituição de pesquisa de primeiro nível, conferência acadêmica reconhecida, revisão por pares, código aberto disponibilizado. Diferente da maioria das publicações sobre GEO no mercado, este paper passa em qualquer crivo de rigor.

GEO-bench: o que é e como foi montado

A contribuição metodológica do paper é o GEO-bench, primeiro benchmark estruturado para avaliar otimização para mecanismos generativos. Os componentes:

10.000 queries. Conjunto amplo de perguntas reais, derivadas de dados de busca pública, fóruns e benchmarks anteriores. As queries são distribuídas em 8 domínios — não foram limitadas a um único setor.

8 domínios. Educação, fatos do dia a dia, saúde, leis e governo, opinião, pessoas e sociedade, ciência e tecnologia, lojas online. A diversidade evita que o resultado reflita apenas as características de um nicho.

Múltiplas fontes por query. Para cada query, foram coletadas as fontes que mecanismos generativos comumente consultam — uma página entre 5 e 30 fontes potenciais. O conjunto de fontes constitui o "corpus" que o modelo lê para gerar resposta.

Variações controladas. Para cada fonte, os autores aplicaram cada um dos 9 métodos de otimização separadamente, gerando versões reescritas. Compararam visibilidade da versão original com a visibilidade de cada versão otimizada.

Modelos avaliados. Resposta gerada por modelos de linguagem (GPT-3.5, GPT-4, entre outros disponíveis na época do estudo).

Métricas de visibilidade. O paper define duas métricas centrais:

Position-adjusted word count — quantas palavras do conteúdo da fonte aparecem na resposta gerada, ajustadas pela posição em que aparecem (palavras no início da resposta valem mais que no fim).

Subjective impression — pontuação subjetiva calculada via modelo que avalia o quanto da fonte está representado na resposta, considerando posição, ênfase e contexto.

A combinação das duas métricas permite leitura rica: não basta aparecer; importa onde aparece e com que ênfase.

Os 9 métodos testados, um a um

O paper testa nove métodos distintos de reescrita. Para cada um, mede o efeito médio em visibilidade comparado ao texto original.

1. Citation Sources (citação de fontes com URLs). Adicionar referências externas com URLs explícitas ao texto. Efeito médio reportado: ganho consistente de visibilidade entre 30% e 40% — um dos métodos com maior retorno e maior consistência entre domínios.

2. Quotation Addition (citações diretas). Inserir citações diretas atribuídas (com aspas e nome do autor ou fonte). Efeito médio: ganho entre 20% e 35% — segundo método de maior retorno consistente.

3. Statistics Addition (dados quantitativos). Adicionar números, percentuais, dados estatísticos com fonte. Efeito médio: ganho entre 20% e 35% — terceiro método de maior retorno, especialmente eficaz em domínios técnicos (ciência, saúde, tecnologia).

4. Fluency Optimization (clareza e leitura fluida). Reescrever para facilitar leitura, reduzir frases longas, melhorar coesão. Efeito médio: ganho moderado entre 10% e 20%, mais consistente em domínios de opinião e dia a dia.

5. Authoritative Tone (tom autoritativo). Reescrever em tom mais formal e assertivo, próximo ao de fonte de referência. Efeito médio: ganho entre 5% e 15%, com variação por domínio (positivo em saúde e leis, neutro em opinião).

6. Technical Terms (terminologia técnica). Acrescentar jargão técnico apropriado ao domínio. Efeito médio: ganho positivo em domínios técnicos (ciência, tecnologia), efeito neutro ou levemente negativo em domínios mais gerais (opinião, dia a dia).

7. Unique Words (vocabulário diferenciado). Usar palavras menos comuns, evitar termos genéricos. Efeito médio: efeito misto, varia muito por domínio. Pequeno ganho em alguns contextos, neutro em outros.

8. Easy-to-Understand (linguagem simples). Reescrever em linguagem mais simples, vocabulário acessível. Efeito médio: efeito misto, próximo a neutro em média — em alguns domínios beneficia, em outros é indiferente.

9. Keyword Stuffing (repetição de palavra-chave). Repetir a palavra-chave alvo várias vezes no texto. Efeito médio: efeito majoritariamente neutro a negativo — modelos de linguagem parecem reconhecer e até penalizar repetição artificial. Resultado importante: prática herdada do SEO pré-2010 não funciona em GEO.

Conclusões principais do paper

A leitura dos resultados produz quatro conclusões centrais.

1. Três métodos com ganho consistente e alto. Citação de fontes, citação direta e estatísticas entregam ganhos significativos (acima de 20%) em quase todos os domínios. São os métodos com melhor relação esforço-retorno.

2. Fluência e tom têm ganho moderado mas estável. Reescrita para clareza e tom autoritativo entregam ganhos menores mas consistentes — boas práticas editoriais que se reforçam.

3. Variação por domínio é grande. Não há "bala de prata universal". Terminologia técnica funciona em ciência e tecnologia; em opinião, pode atrapalhar. Authoritative tone brilha em saúde e leis; em conteúdo do dia a dia, é indiferente. Adaptar método ao domínio é essencial.

4. Keyword stuffing não funciona — e pode prejudicar. Resultado talvez mais importante para o mercado: práticas legadas de SEO baseadas em repetição artificial são, na melhor das hipóteses, indiferentes para LLMs; podem até reduzir visibilidade.

A consequência prática: estratégia de GEO eficaz não é "aplicar todos os 9 métodos sempre". É combinar os métodos certos para o domínio, com prioridade para os três de maior retorno.

Pequena empresa

Foque nos três métodos de maior retorno: citação de fontes com URLs, citações diretas atribuídas e dados estatísticos com fonte. Aplique em conteúdos pilar (artigos longos, evergreen, com tráfego orgânico atual). Tempo de revisão por artigo: 2 a 4 horas. Não tente replicar o benchmark — você não tem amostra para significância. Adote como receita validada por terceiros e meça resultado pela presença em ChatGPT e Perplexity ao buscar suas palavras-chave centrais.

Média empresa

Internalize os 9 métodos como checklist editorial completo. Cada artigo novo passa pela revisão. Conteúdo legado prioritário (top 30 a 100 artigos por tráfego e relevância comercial) é reescrito ao longo de 6 a 12 meses. Use ferramentas de monitoramento de citação em LLMs (Profound, Athena HQ, Otterly.AI) para acompanhar evolução. Mantenha biblioteca interna que registra qual ajuste em qual artigo gerou qual resultado.

Grande empresa

Replica o GEO-bench no seu domínio: define 200 a 1.000 queries representativas, monitora visibilidade em múltiplos LLMs, aplica métodos em amostras controladas, calcula efeito médio em seu corpus. Time de SEO/GEO dedicado, plataforma proprietária ou contratada de monitoramento. Resultados próprios geram playbook adaptado ao mercado e ao domínio específicos. Investimento anual entre R$ 300.000 e R$ 1.500.000 conforme escopo.

O que o paper não diz (e como o mercado o estendeu)

Para evitar interpretação errada, vale isolar o que o paper original testa e o que extrapolações posteriores acrescentaram (sem validação empírica equivalente).

O paper testa. Os 9 métodos de reescrita acima, em 10.000 queries de 8 domínios, contra modelos de linguagem disponíveis na época.

O paper não testa diretamente. Outras práticas que viraram parte do "playbook GEO" no mercado:

E-E-A-T (Experiência, Expertise, Autoridade, Confiança). Conceito do Google Search Quality, extrapolado para GEO mas não testado no paper original.

Schema.org markup. Marcação estruturada de dados que pode ajudar mecanismos de busca, mas não é avaliada no estudo.

Arquivo llms.txt. Convenção emergente proposta no final de 2024 para sinalizar conteúdo destinado a LLMs. Surgiu após a publicação do paper e não é validada por ele.

Páginas em domínios com autoridade alta. Influência reconhecida em SEO, mas não isolada nos testes do paper.

Estrutura semântica (HTML5, marcações de seção). Pode ajudar, mas não foi variável testada.

Isso não significa que essas práticas não funcionem. Significa que quem cita o paper de Princeton para validar E-E-A-T, schema.org ou llms.txt está extrapolando. Esses elementos podem ser úteis, mas a evidência vem de outras fontes (mais fracas que o paper original).

Como adaptar ao português brasileiro

O paper foi testado em inglês, contra modelos otimizados predominantemente em inglês. Aplicar ao mercado brasileiro exige adaptações.

Citação de fontes: use fontes brasileiras de autoridade (IBGE, ANVISA, Receita Federal, universidades brasileiras, periódicos de referência local) quando o tema for nacional. Para temas universais, fontes internacionais reconhecidas (Stanford, Harvard, OMS) funcionam.

Citações diretas: entreviste especialistas brasileiros — não cite só executivos americanos. Citação de Ricardo Amorim ou Kenneth Corrêa em economia funciona melhor para público brasileiro do que tradução de Paul Krugman.

Estatísticas: dados brasileiros (IBGE, FGV, Sebrae) ressoam mais que dados globais para questões locais. Para questões globais (mudança climática, IA), dados internacionais são apropriados.

Tom autoritativo: em português, tom autoritativo se equilibra entre formal e acessível. Português acadêmico puro pode ser pesado demais para consumo geral.

Terminologia técnica: use termos técnicos quando o domínio exige (medicina, direito, engenharia), mas explique siglas na primeira ocorrência. O paper foi testado contra modelos treinados majoritariamente em inglês — adaptação ao vocabulário brasileiro é necessária.

Keyword stuffing: regra mais clara que veio do paper — não funciona em inglês, dificilmente funcionaria em português. Práticas legadas como "incluir palavra-chave em densidade de 2-3%" estão obsoletas.

Implicações para o calendário editorial

Para um time de conteúdo aplicar o paper de forma prática, três artefatos:

Checklist de revisão editorial. Antes de publicar qualquer artigo, revisão verifica: tem ao menos 3 citações de fontes com URLs? Tem ao menos 2 citações diretas atribuídas? Tem ao menos 4 dados quantitativos com fonte? O texto está claro? O tom é apropriado ao domínio?

Priorização de conteúdo legado. Identifique artigos pilar (top tráfego, top relevância comercial, evergreen). Faça revisão GEO desses artigos primeiro — o retorno por artigo é mais alto. Conteúdo de cauda longa pode esperar.

Monitoramento de citação. Defina lista de queries-alvo (as 20 a 100 perguntas mais relevantes para o negócio). Mensalmente, verifique manualmente ou via ferramenta dedicada se sua marca é citada nas respostas geradas. Cresceu? Caiu? Por quê?

Erros comuns ao aplicar o paper

Tratar como receita única. "Apliquei os 9 métodos, vai funcionar." Não. Métodos variam por domínio; alguns são neutros ou negativos no seu contexto. Trate como hipóteses a calibrar, não receita pronta.

Aplicar keyword stuffing achando que é citação. Repetir a palavra-chave em forma de "citação inventada" não vira citação. Citações precisam ser verificáveis, atribuídas a fonte real, com URL ou referência.

Ignorar a metodologia e citar só o resumo de blog. A maior parte do que circula como "paper de Princeton sobre GEO" no mercado é resumo de blog que simplifica demais ou erra a leitura. Ler o paper original (gratuito no arXiv) é prática mínima para quem se apresenta como especialista no tema.

Aplicar em conteúdo de baixíssimo valor. Otimizar para GEO um conteúdo medíocre não melhora o conteúdo — só o torna mais visível em LLM. Qualidade editorial vem antes; GEO é refinamento.

Não medir antes e depois. Aplicar os métodos sem benchmark anterior impede saber se funcionou. Mantenha registro de citação em LLM antes e depois das mudanças.

Confundir GEO com SEO tradicional. São disciplinas relacionadas mas com lógicas diferentes. Ranking em Google Search e citação em ChatGPT têm mecanismos parcialmente sobrepostos, parcialmente distintos. Aplicar SEO tradicional achando que é GEO produz resultados desbalanceados.

Sinais de que sua operação de conteúdo ainda não internalizou o paper

Se três ou mais cenários descrevem seu time de conteúdo hoje, vale revisitar o paper original e ajustar o processo editorial.

O time fala em GEO sem nunca ter aberto o paper original ou o resumo formal no arXiv.
Conteúdo pilar sai sem citações de fontes externas com URLs verificáveis.
Artigos âncora não têm dados quantitativos com fonte explícita.
Não há citações diretas atribuídas a especialistas no editorial.
Checklist de revisão editorial não cobre os 9 métodos.
Práticas pré-2010 (densidade de palavra-chave de 2-3%) ainda estão no playbook.
Decisões de conteúdo se baseiam em opinião de fornecedor (agência, consultor) sem evidência citável.
Não existe monitoramento de citação em ChatGPT, Perplexity ou Gemini para as queries-alvo do negócio.

Caminhos para aplicar o paper na operação

A decisão entre internalizar com equipe própria ou contratar apoio depende do volume de conteúdo, da maturidade da equipe e da centralidade de SEO/GEO na geração de demanda.

Implementação interna

Equipe de conteúdo lê o paper, deriva checklist editorial, aplica em artigos novos e prioriza revisão de legado. Ferramenta de monitoramento de citação acompanha resultado. Indicado quando a equipe tem maturidade editorial e disciplina de processo.

Perfil necessário: analista ou gerente de conteúdo com prática em SEO + tempo para leitura técnica do paper + acesso a ferramenta de monitoramento (Profound, Athena HQ, Otterly.AI, alternativas gratuitas com limitações)
Quando faz sentido: equipe de conteúdo com 2 ou mais profissionais, calendário editorial estruturado, prioridade clara para tráfego orgânico e citação em IA
Investimento: tempo do time (capacitação inicial de 20 a 40 horas) + ferramenta de monitoramento (R$ 1.500 a R$ 8.000 mensais) + revisão editorial (2 a 4 horas adicionais por artigo)

Apoio externo

Agência de SEO/conteúdo ou assessoria de marketing com prática em GEO conduz capacitação, define playbook adaptado ao domínio, audita conteúdo legado e estabelece processo. Empresa interna assume após período de transição.

Perfil de fornecedor: agência de SEO ou geração de conteúdo com prática comprovada em GEO (não só venda de termo na moda), assessoria de marketing com diferencial em IA aplicada
Quando faz sentido: equipe de conteúdo enxuta sem tempo de capacitação, necessidade de aceleração, volume alto de conteúdo legado para revisar
Investimento típico: projeto de capacitação e auditoria entre R$ 25.000 e R$ 120.000 + mensalidade de execução (R$ 8.000 a R$ 40.000) por escopo

Quantos dos 9 métodos GEO estão no checklist de revisão editorial do seu time?

O oHub conecta sua empresa a agências de SEO e geração de conteúdo, assessorias de marketing e serviços de marketing digital com prática em GEO. Em poucos minutos, descreva seu desafio e receba propostas de quem entende o mercado brasileiro.

Solicitar orçamento de Otimização Mecanismos de Busca - SEO Solicitar orçamento de Marketing Digital Solicitar orçamento de Consultoria em Marketing

Sem custo, sem compromisso. Você recebe propostas e decide se e com quem avançar.

Perguntas frequentes

O que diz o paper GEO de Princeton?

O paper "GEO: Generative Engine Optimization" estabelece pela primeira vez fundamento empírico para a otimização de conteúdo destinado a mecanismos generativos (ChatGPT, Perplexity, Gemini). Testa 9 métodos de reescrita em 10.000 queries de 8 domínios, medindo o impacto de cada método na visibilidade do conteúdo dentro de respostas de modelos de linguagem. Conclusão central: três métodos entregam ganho consistente e alto (citação de fontes, citações diretas, dados estatísticos); fluência e tom autoritativo entregam ganho moderado; keyword stuffing tem efeito neutro a negativo.

Quais são os 9 métodos GEO testados?

Os 9 métodos avaliados são: (1) citação de fontes com URLs; (2) citações diretas atribuídas; (3) adição de dados estatísticos; (4) otimização de fluência; (5) tom autoritativo; (6) terminologia técnica; (7) vocabulário diferenciado; (8) linguagem simples; (9) repetição de palavra-chave (keyword stuffing). Cada método foi aplicado isoladamente em versões reescritas de conteúdo, comparando visibilidade contra a versão original em respostas de modelos de linguagem.

Citações aumentam visibilidade em LLM?

Sim, segundo o paper de Princeton — é um dos métodos com maior ganho consistente. Adicionar citações de fontes com URLs explícitas entregou ganhos médios entre 30% e 40% em visibilidade, com efeito positivo em quase todos os domínios testados. Citações diretas atribuídas (com aspas e nome do autor) entregaram ganhos médios entre 20% e 35%. Para aplicação prática, isso significa que conteúdo pilar deve conter pelo menos 3 a 5 citações verificáveis com URL e 2 a 3 citações diretas atribuídas a especialistas reais.

Estatísticas no conteúdo ajudam GEO?

Sim, é o terceiro método de maior retorno consistente do paper. Adicionar dados quantitativos (números, percentuais, dados estatísticos com fonte) entregou ganhos médios entre 20% e 35%, com efeito especialmente positivo em domínios técnicos (ciência, saúde, tecnologia). Estatísticas precisam ser verificáveis e atribuídas a fontes confiáveis — inventar números ou citar fontes vagas pode ser contraproducente. Para o mercado brasileiro, dados do IBGE, FGV, Sebrae, ANVISA e periódicos científicos servem bem como base.

Que método GEO funciona melhor?

Citação de fontes com URLs é o método com maior ganho médio e maior consistência entre domínios (30% a 40% de ganho médio), seguido por citações diretas (20% a 35%) e adição de estatísticas (20% a 35%). Esses três são considerados os métodos de "alto retorno e baixo risco" — funcionam praticamente em qualquer domínio. Fluência e tom autoritativo têm ganho moderado mas estável. Outros métodos (terminologia técnica, vocabulário diferenciado, linguagem simples) variam muito por domínio. Keyword stuffing é o único método com efeito neutro a negativo.

O paper GEO foi publicado em qual evento?

O paper foi apresentado na conferência KDD 2024 (ACM SIGKDD International Conference on Knowledge Discovery and Data Mining), uma das principais conferências acadêmicas na área de descoberta de conhecimento, mineração de dados e aprendizado de máquina. Anteriormente, o paper foi publicado como preprint no arXiv (identificador 2311.09735) em novembro de 2023, com revisões posteriores. Os autores estão afiliados majoritariamente à Princeton University, com colaboradores de IBM e Georgia Tech. Karthik Narasimhan, professor de Ciência da Computação em Princeton, é o pesquisador sênior.