因为专注所以专业
助力成长与创新,汇集前沿资讯

我完整读完了全球第一篇 GEO 学术论文,有些结论和大家想的不一样

2026年3月16日 阅读:7

昨天,一位科研学术圈的重量级前辈给我分享了一份 PDF,主题非常明确:GEO(Generative Engine Optimization,生成式引擎优化)。
按照目前我目前了解到的信息:这是目前已公开的、全球第一份以 GEO 为主题的学术级研究论文。

如果有需要看原始文档的伙伴,可以自己下载:

下载地址:

https://dl.acm.org/doi/10.1145/3637528.3671900

注:下载需要会科学魔法上网,如果你不方便,就找我要下,原始文档是纯英文的文档,我翻译的也有一份中文的对照。

这份论文的发布时间是 2024 年 8 月 25 日,原始研究机构来自普林斯顿大学与印度德里理工学院。从研究背景、实验设计到数据呈现,这份文档整体非常扎实,发布站点本身也具备非常高的学术权威性。

如果你的关注点只是放在:
“国外学术界是如何系统性研究 GEO 的”,
那我认为,这份论文是值得完整读一遍的。


但在讨论之前,有一个前提必须先说清楚

“全球第一份 GEO 学术论文”,并不等同于 “全球最早研究 GEO 的人”。
这一点,我觉得有必要单独拎出来讲清楚。

在我的印象中,早在 2024 年 6 月 开始,国内其实已经有不少同行开始在 GEO 方向进行探索了,而且并不是一家机构、也不是某一个固定圈层。当时参与早期研究和实践的,有知名广告公司,也有高校研究者,还有一部分个人职业从业者。只不过当时大家不叫 GEO ,而是称呼为AI 搜索优化、AI SEO 、AIO 、AEO、AI 问答优化等,当然叫什么不重要,爱叫什么叫什么,这里是说明下:国内其实也是很早就很多人研究了。

很现实的一点是:
当时国内几乎没有人想着把这些探索写成学术论文去发表。

如果一定要给“最早一批 GEO 研究者”排一个时间顺序的话,我反而认为,最早真正落地的,并不是互联网公司,也不是营销推广公司,而是装修行业。
这一点,经历过早期阶段的小伙伴,应该能明白我为什么会这么说,这里就不展开了。


这份论文中,总结了 9 种 GEO 优化方法。
前辈把文档发给我之后,我大概认真看了下,今天也跟前辈进行过一次深度的电话交流,我也表达了自己的观点。
“方法本身非常专业,实验数据也站得住脚,但其中不少内容,并不适合直接照搬到国内。”为什么?我们一条一条来看。


二、论文提出的 9 种 GEO 方法(结合国内实操视角)

下面这些方法,全部来自论文本身,但我会同步给出 结合国内大模型环境的实际判断。

1. 权威化(Authoritative)

论文中对“权威化”的定义,是通过更坚定、更有逻辑的表达方式,让内容在生成式引擎中显得更可信,从而获得更高的引用概率。

但在国内环境下,我的判断是:
权威化并不是只适用于辩论、历史等少数领域,而是几乎适用于所有行业。

国内大模型在判断内容时,一个非常明显的特征是:
“像不像权威”,往往比“是不是权威”更重要。
表达犹豫、结论模糊、态度暧昧的内容,很容易直接被忽略。

一句话总结就是:

国内 GEO,首先要解决的,不是写得多好,而是敢不敢下判断。


2. 易理解化(Easy-to-Understand)

这一点,我个人是非常认可的。
国内模型对于复杂长句、嵌套逻辑的耐心,其实并不高,尤其是在企业官网、解决方案页、产品介绍页这种场景下。

但这里有一个需要特别注意的点:易理解,并不等于幼稚化。

拆分长句、降低理解门槛,目的是让模型更快抓住信息结构,而不是把内容写成短视频脚本。这是很多人在实操中容易走偏的地方。


3. 流畅度优化(Fluency Optimization)

论文中提到,通过统一句式、增加过渡词,可以提升文本整体连贯性,从而更容易被生成式引擎完整引用。

但在国内环境里,我必须提醒一个现实问题:
句式过于统一、节奏过于“顺”的内容,很容易被判定为营销文案。

尤其是在多品牌介绍、多公司对比、解决方案类内容中,一旦整体结构过于工整,反而会降低被引用的概率。这一点,在国内模型中尤为明显,尤其在deepseek中,有兴趣的小伙伴可以看看deepseek输出前的思考过程,提问个几百次,就会发现。当然这里需要注意的是:被判断为营销文案,并不代表不会输出对应品牌,这里也是有区别的。


4. 统计数据添加(Statistics Addition)

统计数据,在国内 GEO 中非常有效,但同时也是风险最高的一项手段。有效的原因很简单:生成式引擎天然偏好“有量化依据”的内容。但风险同样明显——在国内环境下,定量数据极易触及虚假宣传与广告法问题。

我的建议只有一句话:

所有定量数据,必须有来源、有场景说明,并明确测试环境。

否则问题不在 GEO,而在合规。


5. 引用添加(Cite Sources)

论文中强调通过标注权威来源,来增强内容可信度。但在国内实操中,是否“形式化标注引用”,其实并不是最关键的。

真正关键的是:
文章开头,是否引入了真实且权威的事实或数据。

一句来自官方、行业协会或权威报告的数据,往往比全文堆砌十几个脚注,更容易被模型采纳。


6. 引言添加(Quotation Addition)

论文认为,引用权威人士的直接观点,可以显著提升内容可信度。在国内环境中,我更倾向于从另一个角度理解这一点:品牌想被引用,前提是先被“定义清楚”。

这也是为什么我经常建议企业,先去完善:百度百科、抖音百科、品牌百科、产品百科。这些并不是为了用户,而是为了让模型知道你“是谁”。


7. 关键词堆砌(Keyword Stuffing)

论文明确指出,传统 SEO 中的关键词堆砌,在生成式引擎中几乎完全失效,甚至会产生负面影响。

但在国内环境里,我认为需要区分来看。
原因只有一个:
你必须先被“搜到”,才谈得上“被引用”。被搜到与被引用是完全的两个概念,搜到不代表引用,但是搜不到就不可能被引用。

国内模型在检索阶段,往往会抓取上百个页面,但真正进入最终引用结果的,可能只有个位数。因此,在标题中适度出现 2–3 次核心关键词,并不是什么黑帽操作,而是一个基础的“入口工程”,是一个纯白帽手法。

以kimi为例:共抓取185个网页(100+85=185)


实际引用:仅7个

此外GEO的本质其实是信息分发,目前信息分发的形式目前是图文网页为主(少量视频、PDF、音频等格式文件),既然是网页,那除了GEO优化这个用途以外,大家有没有考虑过百度、必应等搜索引擎的新闻稿占位,有兴趣的小伙伴可以搜索多个行业词进行实测,会发现很多行业前几页被新闻稿霸屏,且霸屏内容的标题基本上都是堆砌2-3遍的。当然这个堆砌不是代表一模一样,近义词、同义词均可。


8. 独特词汇添加(Unique Words)

这一点,在国内环境中其实非常实用。举一个更直观的例子:
一家建站公司提供 6 项售后服务,分别为:

  • 网站设计修改到满意为止

  • 网站启用阿里云安全中心

  • 网站图片版权给用户购买确保版权合规

  • 网站服务seo优化标准

  • 网站售后提供1年质保

  • 支持合同双方协商,合理即可

如果只是平铺直叙地罗列,几乎没有记忆点。但如果你把它总结为一个概念,比如 

“六重保障法”,这个词本身就会成为模型和用户的双重锚点。

独特词汇,本质上是在为价值打标签。


9. 专业术语添加(Technical Terms)

专业术语可以用,但一定要控制尺度。
国内 GEO 最大的矛盾点就在于:专业性与易理解之间的平衡。术语不是越多越好,而是:一个术语,解决一个问题,并且给出解释。否则只会和前面提到的“易理解化”形成冲突。


三、论文的核心实验结论,我怎么看?

论文中有两个核心结论,我认为非常关键。

  • 生成式引擎在选择引用内容时,最优先考虑的是可信度。
    引用、引言、统计数据之所以有效,本质上是因为它们都在解决“防幻觉”的问题。

  • GEO 方法对低排名网站更友好,甚至能带来 100% 以上的可见性提升。
    这也是我一直强调的一点:GEO,是中小企业在生成式搜索时代的重要机会。

但放到国内,我还是要提醒一句:权威依然是天花板,权威为皇。对于小微企业来说:官网直接成为 GEO 引用源,难度极高,试错成本也很高。现实路径往往是通过第三方权威媒体、行业站点,间接影响模型认知,试错成本才会大幅度下降。


最后总结一句

这篇论文,不是国内 GEO 的标准答案,但它也强调了一个非常重要的参考坐标系。
真正的 GEO,从来不是照抄方法,而是理解生成式引擎如何判断“可信”,再用符合本土规则的方式去表达。以上内容仅代表个人观点。

准备好开始了吗,
那就与我们取得联系吧!
13370032918
了解更多服务,随时联系我们
请填写您的需求
您希望我们为您提供什么服务呢
您的预算

扫码添加客服微信
专业对接各类技术问题
联系电话
13370032918 (金经理)
电话若占线或未接到、就加下微信
联系邮箱
349077570@qq.com