帮玄奘开口说话

北京晚报

2026-04-24 13:37

011

　　▌谢秉强
　　“世界读书日”刚刚过去，不得不说，无论读书人、写书人还是做书人，在面对强大的人工智能工具时，都有点小小的焦虑。还好，我们还有书，还有书籍带来的知识和提供的操作场景，为解决焦虑开辟出一条条路……

《第一次遇见玄奘》谢秉强著上海人民出版社上海书店出版社

西安大雁塔广场的玄奘像。视觉中国供图

　　今年“世界读书日”前夕，我完成了一个小项目：给自己新出的小书《第一次遇见玄奘》做一个配套的可视化网站“跟玄奘游大唐西域”。我在三维地球上标注了玄奘西行十七年间途经的近两百个地点，每个点位都有经过考证的词条与配图，词条文本逾二十万字，背后还有超过百万字的知识库支撑一个AI问答系统。
　　上线之后，我最常被问到的一个问题是：这些是AI写的吗？答案比“是”或“不是”复杂得多。而这种复杂性，恰好折射出AI正在如何改变我们与书本、与知识的关系。
　　一本小书装不下的东西
　　写《第一次遇见玄奘》时，我面对的最大困难其实不是写什么，而是不写什么。玄奘西行途经一百多个国家和城邦，每一处都有值得展开的故事——高昌王的深夜挽留，西突厥可汗大帐里的讲经，那烂陀寺万人僧团的日常运转。一本面向青少年的小书，篇幅有限，大量细节只能忍痛割爱。
　　而作为书本，它还有天然的限制：读者多想看看那条让玄奘尴尬落水的大河，想知道他记载的阿旃陀石窟有多美丽壮观，想听听他描述的引发后人无穷想象的铁门关的铁铃声……
　　可视化网站解决了这个问题。它让内容从一个线性的“小”展开为一个立体的“大”：地图上的每个点位就是一篇独立的微型文章，涵盖玄奘的见闻、与其他旅行家的对照、今日考古发现、图像或音视频。读者在三维地球上旋转、缩放、点击，从长安一路到那烂陀，每个国家的详情都可以逐一展开。这是书本做不到的——你不可能在一本书里嵌入193篇词条和对应的地理坐标。
　　而AI问答系统则从另一个维度把“小”变成了更小、更私人的“小”——那些读者心里时常生出的但不太好意思在正式场合问的问题。这其实也是我在书里想重点写作的，比如：他取经路上是孤身一人，还是有队伍？一路上怎样吃住？有没有语言障碍，需要翻译吗？他的外语水平怎样？看到了哪些他觉得有意思的事物？甚至，他觉得什么东西好吃，什么不好吃？诸如此类的问题。
　　当读者可以和玄奘对话
　　于是，在这样的AI问答系统里，读者就可以用各种问题直接向“玄奘”提问，他会以第一人称作答，自称“贫僧”，称读者为“施主”，态度谦和，偶尔还带点幽默。
　　比如有人问他：“您在地理上有哪些错误认知？”他老实承认了自己沿用《尚书·禹贡》的说法，以为塔里木河注入罗布泊后会潜流地下、最终从积石山冒出成为黄河源头——然后补了一句，“毕竟那时候还没有卫星地图嘛。”
　　但更让我意外的是那些“小问题”。有读者问：“法师，您在那烂陀寺每天吃什么？”数字玄奘认真地回答了：每天一百二十颗瞻步罗果、二十颗槟榔、一升“供大人米”（国王特供的精米），还有豆蔻等。这些细节确实记录在《慈恩传》里，但普通读者很难查阅。还有人问他翻越帕米尔高原时最害怕什么、带回来的经书有多重、路上最感谢的人是谁——这些问题看似琐碎，却恰恰是真实的好奇心。在课堂上、在学术讲座中，人们往往只问“宏大”的问题；面对一个AI，反而敢问出那些朴素的、关乎一个活生生的人的问题。
　　这背后是一套检索增强生成（RAG）系统：把《大唐西域记》《慈恩传》以及当代学者的研究论文拆分成语义片段，存入向量数据库。读者提问时，系统先从知识库里检索最相关的段落，再交给大语言模型组织回答。 AI不是在“编”，而是在替读者翻阅那上百万字的资料，找到最切题的部分，再用自然语言讲出来。
　　知识库里不只有古籍，还有近年出版的玄奘研究专著、丝路考古报告，都被拆解后灌入。这意味着读者提问时，得到的不只是一千三百年前的记载，还有当代学者的研究成果作为补充甚至修正。
　　比如，玄奘记载他到过“劫比罗伐窣堵国”，惜乎语焉不详。但1896年，考古学家根据玄奘书中对它的方位描述，在今天尼泊尔的蓝毗尼发现了阿育王石柱，证实这里就是释迦牟尼的诞生地。类似的例子还有很多：斯坦因循着《大唐西域记》的线索发现尼雅遗址，印度学者夏尔玛在玄奘描述的位置发掘出了憍赏弥古城。这些考古发现反过来验证了玄奘记载的可靠性，也成了系统回答相关问题时的重要依据。
　　帮更多人与更多知识相遇
　　现在，回到开始那个“是不是AI写的”问题。二十万字的词条当然不是让AI从无到有生成的——那样出来的东西，看着流畅，却经不起推敲。哪些信息值得写进去，哪些说法需要存疑，哪些考古发现足以修正传统认知……这些判断仍然是人在做。
　　比如书中全部点位数据以杨廷福先生的《玄奘年谱》为骨架。这本年谱在整个网站的搭建过程中，起到了决定性的作用——耳边响起意大利学者艾柯的话：别想摆脱书。但AI确实深度参与了整个过程。比如词条写作采用了“年谱定位→原典叙事→今日遗址”的三层叙述结构，体例的制定、今日遗址考古信息的挖掘，都是AI帮助去繁就简、翻译整理。于是，人机协作的每一个词条下，古今叠映，让阅读经典不再是单纯的复古，而是成为一场跨越时空的对照。
　　论及AI对阅读的影响，争议从未停过。一种常见的焦虑是：如果AI能帮你总结一本书，你还会去读原著吗？
　　我的经验恰好相反。在做玄奘项目的过程中，我就反复地比对查看《大唐西域记》《慈恩传》《玄奘年谱》以及大量学术作品，每个缝隙都不错过。同时我坚信，这样的热情应该也能感染部分看这个可视化站的读者，就像我书中序言说的，最终是鼓励大家“上楼抽梯”，去对确实不太好读的原著发生兴趣。
　　而在全球范围内，AI与阅读的结合正在加速，形成了几条清晰的路径。
　　比如谷歌的NotebookLM允许用户把PDF、网页、音频等各种格式的资料上传，形成一个私人的“数字大脑”，然后与之对话——它甚至能把你上传的论文自动生成一期播客节目，两个AI主持人有来有回地讨论你的资料。这对学术阅读的效率提升是显而易见的。
　　在古典文献领域，神经网络成功破译2000年前烧焦的卷轴，这个新闻让人震惊之余，谷歌DeepMind与牛津大学等机构合作的Ithaca项目又取得了令人瞩目的成果：这套AI系统能修复残损的古希腊铭文、判断铭文的产地和年代。单独使用时准确率为62%，但当历史学家与Ithaca协作时，准确率从25%跃升至72%——这可能是“人机协作”最有说服力的案例之一。
　　纽约大都会艺术博物馆与OpenAI合作，创造了一个“生活在20世纪30年代的女性”AI角色，用那个年代的语言和观念为参观者讲解馆藏。
　　这些项目的共同特点是：AI没有取消阅读，而是降低了进入的门槛、丰富了阅读的形态。不管是用自然语言检索古籍，还是与历史人物“聊天”，技术做的事情始终是同一件——帮助更多人与更多知识相遇。

打开APP阅读全文