独家解析全球首份GEO学术论文：9大方法很专业

2026年3月16日阅读：104

昨天，一位科研学术圈的重量级前辈给我分享了一份 PDF，主题非常明确：GEO（Generative Engine Optimization，生成式引擎优化）。
按照目前我目前了解到的信息：这是目前已公开的、全球第一份以 GEO 为主题的学术级研究论文。

如果有需要看原始文档的伙伴，可以自己下载：

下载地址：

https://dl.acm.org/doi/10.1145/3637528.3671900

注：下载需要会科学魔法上网，如果你不方便，就找我要下，原始文档是纯英文的文档，我翻译的也有一份中文的对照。

这份论文的发布时间是 2024 年 8 月 25 日，原始研究机构来自普林斯顿大学与印度德里理工学院。从研究背景、实验设计到数据呈现，这份文档整体非常扎实，发布站点本身也具备非常高的学术权威性。

如果你的关注点只是放在：
“国外学术界是如何系统性研究 GEO 的”，
那我认为，这份论文是值得完整读一遍的。

但在讨论之前，有一个前提必须先说清楚

“全球第一份 GEO 学术论文”，并不等同于 “全球最早研究 GEO 的人”。
这一点，我觉得有必要单独拎出来讲清楚。

在我的印象中，早在 2024 年 6 月开始，国内其实已经有不少同行开始在 GEO 方向进行探索了，而且并不是一家机构、也不是某一个固定圈层。当时参与早期研究和实践的，有知名广告公司，也有高校研究者，还有一部分个人职业从业者。只不过当时大家不叫 GEO ，而是称呼为AI 搜索优化、AI SEO 、AIO 、AEO、AI 问答优化等，当然叫什么不重要，爱叫什么叫什么，这里是说明下：国内其实也是很早就很多人研究了。

很现实的一点是：
当时国内几乎没有人想着把这些探索写成学术论文去发表。

如果一定要给“最早一批 GEO 研究者”排一个时间顺序的话，我反而认为，最早真正落地的，并不是互联网公司，也不是营销推广公司，而是装修行业。
这一点，经历过早期阶段的小伙伴，应该能明白我为什么会这么说，这里就不展开了。

这份论文中，总结了 9 种 GEO 优化方法。
前辈把文档发给我之后，我大概认真看了下，今天也跟前辈进行过一次深度的电话交流，我也表达了自己的观点。
“方法本身非常专业，实验数据也站得住脚，但其中不少内容，并不适合直接照搬到国内。”为什么？我们一条一条来看。

二、论文提出的 9 种 GEO 方法（结合国内实操视角）

下面这些方法，全部来自论文本身，但我会同步给出结合国内大模型环境的实际判断。

1. 权威化（Authoritative）

论文中对“权威化”的定义，是通过更坚定、更有逻辑的表达方式，让内容在生成式引擎中显得更可信，从而获得更高的引用概率。

但在国内环境下，我的判断是：
权威化并不是只适用于辩论、历史等少数领域，而是几乎适用于所有行业。

国内大模型在判断内容时，一个非常明显的特征是：
“像不像权威”，往往比“是不是权威”更重要。
表达犹豫、结论模糊、态度暧昧的内容，很容易直接被忽略。

一句话总结就是：

国内 GEO，首先要解决的，不是写得多好，而是敢不敢下判断。

2. 易理解化（Easy-to-Understand）

这一点，我个人是非常认可的。
国内模型对于复杂长句、嵌套逻辑的耐心，其实并不高，尤其是在企业官网、解决方案页、产品介绍页这种场景下。

但这里有一个需要特别注意的点：易理解，并不等于幼稚化。

拆分长句、降低理解门槛，目的是让模型更快抓住信息结构，而不是把内容写成短视频脚本。这是很多人在实操中容易走偏的地方。

3. 流畅度优化（Fluency Optimization）

论文中提到，通过统一句式、增加过渡词，可以提升文本整体连贯性，从而更容易被生成式引擎完整引用。

但在国内环境里，我必须提醒一个现实问题：
句式过于统一、节奏过于“顺”的内容，很容易被判定为营销文案。

尤其是在多品牌介绍、多公司对比、解决方案类内容中，一旦整体结构过于工整，反而会降低被引用的概率。这一点，在国内模型中尤为明显，尤其在deepseek中，有兴趣的小伙伴可以看看deepseek输出前的思考过程，提问个几百次，就会发现。当然这里需要注意的是：被判断为营销文案，并不代表不会输出对应品牌，这里也是有区别的。

4. 统计数据添加（Statistics Addition）

统计数据，在国内 GEO 中非常有效，但同时也是风险最高的一项手段。有效的原因很简单：生成式引擎天然偏好“有量化依据”的内容。但风险同样明显——在国内环境下，定量数据极易触及虚假宣传与广告法问题。

我的建议只有一句话：

所有定量数据，必须有来源、有场景说明，并明确测试环境。

否则问题不在 GEO，而在合规。

5. 引用添加（Cite Sources）

论文中强调通过标注权威来源，来增强内容可信度。但在国内实操中，是否“形式化标注引用”，其实并不是最关键的。

真正关键的是：
文章开头，是否引入了真实且权威的事实或数据。

一句来自官方、行业协会或权威报告的数据，往往比全文堆砌十几个脚注，更容易被模型采纳。

6. 引言添加（Quotation Addition）

论文认为，引用权威人士的直接观点，可以显著提升内容可信度。在国内环境中，我更倾向于从另一个角度理解这一点：品牌想被引用，前提是先被“定义清楚”。

这也是为什么我经常建议企业，先去完善：百度百科、抖音百科、品牌百科、产品百科。这些并不是为了用户，而是为了让模型知道你“是谁”。

7. 关键词堆砌（Keyword Stuffing）

论文明确指出，传统 SEO 中的关键词堆砌，在生成式引擎中几乎完全失效，甚至会产生负面影响。

但在国内环境里，我认为需要区分来看。
原因只有一个：
你必须先被“搜到”，才谈得上“被引用”。被搜到与被引用是完全的两个概念，搜到不代表引用，但是搜不到就不可能被引用。

国内模型在检索阶段，往往会抓取上百个页面，但真正进入最终引用结果的，可能只有个位数。因此，在标题中适度出现 2–3 次核心关键词，并不是什么黑帽操作，而是一个基础的“入口工程”，是一个纯白帽手法。

以kimi为例：共抓取185个网页（100+85=185）

实际引用：仅7个

此外GEO的本质其实是信息分发，目前信息分发的形式目前是图文网页为主（少量视频、PDF、音频等格式文件），既然是网页，那除了GEO优化这个用途以外，大家有没有考虑过百度、必应等搜索引擎的新闻稿占位，有兴趣的小伙伴可以搜索多个行业词进行实测，会发现很多行业前几页被新闻稿霸屏，且霸屏内容的标题基本上都是堆砌2-3遍的。当然这个堆砌不是代表一模一样，近义词、同义词均可。

8. 独特词汇添加（Unique Words）

这一点，在国内环境中其实非常实用。举一个更直观的例子：
一家建站公司提供 6 项售后服务，分别为：

网站设计修改到满意为止
网站启用阿里云安全中心
网站图片版权给用户购买确保版权合规
网站服务seo优化标准
网站售后提供1年质保
支持合同双方协商，合理即可

如果只是平铺直叙地罗列，几乎没有记忆点。但如果你把它总结为一个概念，比如

“六重保障法”，这个词本身就会成为模型和用户的双重锚点。

独特词汇，本质上是在为价值打标签。

9. 专业术语添加（Technical Terms）

专业术语可以用，但一定要控制尺度。
国内 GEO 最大的矛盾点就在于：专业性与易理解之间的平衡。术语不是越多越好，而是：一个术语，解决一个问题，并且给出解释。否则只会和前面提到的“易理解化”形成冲突。

三、论文的核心实验结论，我怎么看？

论文中有两个核心结论，我认为非常关键。

生成式引擎在选择引用内容时，最优先考虑的是可信度。
引用、引言、统计数据之所以有效，本质上是因为它们都在解决“防幻觉”的问题。
GEO 方法对低排名网站更友好，甚至能带来 100% 以上的可见性提升。
这也是我一直强调的一点：GEO，是中小企业在生成式搜索时代的重要机会。

但放到国内，我还是要提醒一句：权威依然是天花板，权威为皇。对于小微企业来说：官网直接成为 GEO 引用源，难度极高，试错成本也很高。现实路径往往是通过第三方权威媒体、行业站点，间接影响模型认知，试错成本才会大幅度下降。

最后总结一句

这篇论文，不是国内 GEO 的标准答案，但它也强调了一个非常重要的参考坐标系。
真正的 GEO，从来不是照抄方法，而是理解生成式引擎如何判断“可信”，再用符合本土规则的方式去表达。以上内容仅代表个人观点。

GEO 生成式引擎优化学术论文

上一个观点返回列表下一个观点