恼人处亦可人
北京晚报

2026-03-14 13:33 语音播报


  王凡
  如今,我是离不开AI(人工智能)了,常让它帮忙听、说、读、写、思。久而久之,也就品出些许滋味,有点像老北京的豆汁儿,头一口酸涩,再细咂摸,那股回甘就上来了。
  先说说AI带来的“酸涩”。我喜欢在开车或跑步时听小说,AI的介入,使得有声朗读的自然度和真实度大幅提升,情感表达也更具逻辑性和连贯性,可一些“低级”的错误仍难避免。最近正听一部长篇小说,讲老薛开了家宫廷御菜饭店,里头有这么一段:“老薛会做家常菜,宫廷御菜不是他所长。客人就座后,服务员倒茶……”“所长(cháng)”一词念成“所长(zhǎng)”——老薛从厨师变成干部;“倒(dào)茶”一词念成“倒(dǎo)茶”——看来服务员要砸场子。而后,我把一段音频转为文字,生成的结果更别扭:“这个厨师不会做‘官廷御菜’。而‘宫盐豫菜’怎么做,做出来是什么味道,老薛又不懂。”“官廷御菜”“宫盐豫菜”,真是闻所未闻,还要人工修改这些没头没脑的错误。
  再比如用AI画画,也挺“酸涩”。为了让它画一幅“人从婴儿到老年发展的五个阶段”的插图,我折腾了半个多钟头,呈现的效果始终不如意:婴儿的皮肤皱皱巴巴,壮年人的身体比例失调,老年人的皱纹长错地方……我有点着急,向一位在人工智能领域深耕的朋友请教,他慢悠悠地对我说:“您多担待吧!AI画画遵守的是‘局部性’和‘平移等变性’的原则,只能在方寸间拼凑。它所谓的‘创作’,就是这套逻辑的产物。”听他这么一解释,再瞅瞅那些歪七扭八的插图,我的气就顺了——新技术总有跑偏的时候,反倒是这些“错”,能让人感受到别样的意味。
  平心而论,AI带给我的,更多是“物喜”。前阵子看新闻,某零食品牌制作海报时误用了AI生成的图片素材,惊现花生悬挂枝头的“奇观”,有网友不禁发问:“难道你家研发出花生树这个新品种?”我读后哑然失笑,继而细想,如果找一位生活经验丰富的平面设计师,肯定不会设计出如此“物喜”的画面,AI是真“敢”画。但它犯错也没有别的企图,完全是纯粹的、无辜的——尽管AI具有高效处理海量信息的能力,但它在接收指令时极易产生误解,进而打捞出错误的信息,生成它以为“正确”的答案。这种“以为”,恰恰反映出它与人类认知之间的鸿沟。有鸿沟未必是坏事,能促使我们去反思:AI为何出错?错在什么环节?怎样做才能让这个如孩童般的智能体健康成长?
  总之,“烦恼”也好,“物喜”也罢,AI只是一面镜子,揭示了人类语言的习惯、思维与审美的特性,用时髦的话来形容,就是“人味儿”——“长”与“倒”的误读,反映出汉语多音字在实际使用中的复杂性;“少年老成”与“花生上树”,反映出客观存在是审美的物质前提,而审美又是客观存在成为“美”的关键。AI现存的这些“毛病”,是技术发展过程中必须面对的问题,我们要做的,是让它在模拟人类意识的道路上,越来越智能,也越来越“懂事”,最终与人类达到同步。

打开APP阅读全文