帮玄奘开口说话
北京晚报

2026-04-24 13:37 语音播报


  ▌谢秉强
  “世界读书日”刚刚过去,不得不说,无论读书人、写书人还是做书人,在面对强大的人工智能工具时,都有点小小的焦虑。还好,我们还有书,还有书籍带来的知识和提供的操作场景,为解决焦虑开辟出一条条路……

《第一次遇见玄奘》谢秉强 著上海人民出版社上海书店出版社

西安大雁塔广场的玄奘像。视觉中国 供图

  今年“世界读书日”前夕,我完成了一个小项目:给自己新出的小书《第一次遇见玄奘》做一个配套的可视化网站“跟玄奘游大唐西域”。我在三维地球上标注了玄奘西行十七年间途经的近两百个地点,每个点位都有经过考证的词条与配图,词条文本逾二十万字,背后还有超过百万字的知识库支撑一个AI问答系统。
  上线之后,我最常被问到的一个问题是:这些是AI写的吗?答案比“是”或“不是”复杂得多。而这种复杂性,恰好折射出AI正在如何改变我们与书本、与知识的关系。
  一本小书装不下的东西
  写《第一次遇见玄奘》时,我面对的最大困难其实不是写什么,而是不写什么。玄奘西行途经一百多个国家和城邦,每一处都有值得展开的故事——高昌王的深夜挽留,西突厥可汗大帐里的讲经,那烂陀寺万人僧团的日常运转。一本面向青少年的小书,篇幅有限,大量细节只能忍痛割爱。
  而作为书本,它还有天然的限制:读者多想看看那条让玄奘尴尬落水的大河,想知道他记载的阿旃陀石窟有多美丽壮观,想听听他描述的引发后人无穷想象的铁门关的铁铃声……
  可视化网站解决了这个问题。它让内容从一个线性的“小”展开为一个立体的“大”:地图上的每个点位就是一篇独立的微型文章,涵盖玄奘的见闻、与其他旅行家的对照、今日考古发现、图像或音视频。读者在三维地球上旋转、缩放、点击,从长安一路到那烂陀,每个国家的详情都可以逐一展开。这是书本做不到的——你不可能在一本书里嵌入193篇词条和对应的地理坐标。
  而AI问答系统则从另一个维度把“小”变成了更小、更私人的“小”——那些读者心里时常生出的但不太好意思在正式场合问的问题。这其实也是我在书里想重点写作的,比如:他取经路上是孤身一人,还是有队伍?一路上怎样吃住?有没有语言障碍,需要翻译吗?他的外语水平怎样?看到了哪些他觉得有意思的事物?甚至,他觉得什么东西好吃,什么不好吃?诸如此类的问题。
  当读者可以和玄奘对话
  于是,在这样的AI问答系统里,读者就可以用各种问题直接向“玄奘”提问,他会以第一人称作答,自称“贫僧”,称读者为“施主”,态度谦和,偶尔还带点幽默。
  比如有人问他:“您在地理上有哪些错误认知?”他老实承认了自己沿用《尚书·禹贡》的说法,以为塔里木河注入罗布泊后会潜流地下、最终从积石山冒出成为黄河源头——然后补了一句,“毕竟那时候还没有卫星地图嘛。”
  但更让我意外的是那些“小问题”。有读者问:“法师,您在那烂陀寺每天吃什么?”数字玄奘认真地回答了:每天一百二十颗瞻步罗果、二十颗槟榔、一升“供大人米”(国王特供的精米),还有豆蔻等。这些细节确实记录在《慈恩传》里,但普通读者很难查阅。还有人问他翻越帕米尔高原时最害怕什么、带回来的经书有多重、路上最感谢的人是谁——这些问题看似琐碎,却恰恰是真实的好奇心。在课堂上、在学术讲座中,人们往往只问“宏大”的问题;面对一个AI,反而敢问出那些朴素的、关乎一个活生生的人的问题。
  这背后是一套检索增强生成(RAG)系统:把《大唐西域记》《慈恩传》以及当代学者的研究论文拆分成语义片段,存入向量数据库。读者提问时,系统先从知识库里检索最相关的段落,再交给大语言模型组织回答。 AI不是在“编”,而是在替读者翻阅那上百万字的资料,找到最切题的部分,再用自然语言讲出来。
  知识库里不只有古籍,还有近年出版的玄奘研究专著、丝路考古报告,都被拆解后灌入。这意味着读者提问时,得到的不只是一千三百年前的记载,还有当代学者的研究成果作为补充甚至修正。
  比如,玄奘记载他到过“劫比罗伐窣堵国”,惜乎语焉不详。但1896年,考古学家根据玄奘书中对它的方位描述,在今天尼泊尔的蓝毗尼发现了阿育王石柱,证实这里就是释迦牟尼的诞生地。类似的例子还有很多:斯坦因循着《大唐西域记》的线索发现尼雅遗址,印度学者夏尔玛在玄奘描述的位置发掘出了憍赏弥古城。这些考古发现反过来验证了玄奘记载的可靠性,也成了系统回答相关问题时的重要依据。
  帮更多人与更多知识相遇
  现在,回到开始那个“是不是AI写的”问题。二十万字的词条当然不是让AI从无到有生成的——那样出来的东西,看着流畅,却经不起推敲。哪些信息值得写进去,哪些说法需要存疑,哪些考古发现足以修正传统认知……这些判断仍然是人在做。
  比如书中全部点位数据以杨廷福先生的《玄奘年谱》为骨架。这本年谱在整个网站的搭建过程中,起到了决定性的作用——耳边响起意大利学者艾柯的话:别想摆脱书。但AI确实深度参与了整个过程。比如词条写作采用了“年谱定位→原典叙事→今日遗址”的三层叙述结构,体例的制定、今日遗址考古信息的挖掘,都是AI帮助去繁就简、翻译整理。于是,人机协作的每一个词条下,古今叠映,让阅读经典不再是单纯的复古,而是成为一场跨越时空的对照。
  论及AI对阅读的影响,争议从未停过。一种常见的焦虑是:如果AI能帮你总结一本书,你还会去读原著吗?
  我的经验恰好相反。在做玄奘项目的过程中,我就反复地比对查看《大唐西域记》《慈恩传》《玄奘年谱》以及大量学术作品,每个缝隙都不错过。同时我坚信,这样的热情应该也能感染部分看这个可视化站的读者,就像我书中序言说的,最终是鼓励大家“上楼抽梯”,去对确实不太好读的原著发生兴趣。
  而在全球范围内,AI与阅读的结合正在加速,形成了几条清晰的路径。
  比如谷歌的NotebookLM允许用户把PDF、网页、音频等各种格式的资料上传,形成一个私人的“数字大脑”,然后与之对话——它甚至能把你上传的论文自动生成一期播客节目,两个AI主持人有来有回地讨论你的资料。这对学术阅读的效率提升是显而易见的。
  在古典文献领域,神经网络成功破译2000年前烧焦的卷轴,这个新闻让人震惊之余,谷歌DeepMind与牛津大学等机构合作的Ithaca项目又取得了令人瞩目的成果:这套AI系统能修复残损的古希腊铭文、判断铭文的产地和年代。单独使用时准确率为62%,但当历史学家与Ithaca协作时,准确率从25%跃升至72%——这可能是“人机协作”最有说服力的案例之一。
  纽约大都会艺术博物馆与OpenAI合作,创造了一个“生活在20世纪30年代的女性”AI角色,用那个年代的语言和观念为参观者讲解馆藏。
  这些项目的共同特点是:AI没有取消阅读,而是降低了进入的门槛、丰富了阅读的形态。不管是用自然语言检索古籍,还是与历史人物“聊天”,技术做的事情始终是同一件——帮助更多人与更多知识相遇。

打开APP阅读全文