试想一下,一位《人民日报》的资深读者,牢牢记住了该报70年来的所有报道,他能在今日的头版中读出什么门道呢?
长久以来,中国官媒《人民日报》被认为是洞悉中南海最新政策的重要窗口,许多中国观察家每天的第一项工作就是:埋头细读《人民日报》头版,从中寻找变化的蛛丝马迹。在不久的将来,记忆力远超人类读者的人工智能或能代劳这一工作。
最近,两位身在华盛顿的年轻华裔研究员研发出一项名为“政策变动指数”(Policy Change Index)的人工智能程序,它犹如一位《人民日报》的死忠读者,“熟读” 该报及其前身《晋察冀日报》自1946年来发布的全部200万篇文章。
根据程序设定,如果这位人工智能读者一觉醒来,读到当日的头版觉得非常惊讶,就说明这篇文章偏离了该报此前的采编思路。如果该程序持续对头版信息感到“惊讶”,就意味着北京的宣传思路转向,新的政策可能要横空出世了。
打造《人民日报》的超级读者
这位人工智能读者的诞生,要从2017年一场在华盛顿的饭局说起。
35岁的智库研究员钟伟锋和34岁的经济政策咨询师陈子健分别来自广东与香港,是相识多年的老友,两人一直对中国政府的宣传口径感兴趣,花了大半年时间在《人民日报》公开数据库中抓取了200万篇报导。
“但想来想去,不知道该怎么用。”钟伟峰接受BBC中文采访时回忆说。人工智能的优势是能在短时间内消化庞大的数据量,通过复杂的计算给出一个答案,但在那之前,研究员必须抛给人工智能一个有意义的问题。
就在这场再平凡不过的朋友聚餐中,两人你一言我一语,掀起一场头脑风暴。
“人工智能可以用来判断文章出现在哪一版。”
“这哪有意思呀?谁在意文章来自报纸的哪一版?”
“但头版就不一样了!不如判断一篇文章是否足够重要到出现在头版?这就有意思了。”
在新政策出台前,中国政府通常预先调整舆论方向。被认为是中国官媒之首的《人民日报》是反映国内政策的风向标,尤以头版文章最为重要,传达着当局重点宣传的纲领性政策。中国领导人如果几天不在《人民日报》头版露面,海外中国观察界就能炸开了锅。若能及时感知到头版的新舆论取向,就如掌握了中国政治的水晶球,可观察到北京的最新政策取向。
钟伟锋和陈子健这项听起来复杂高深的研究,其实内核相当简单:让人工智能去模仿一位经验丰富且有洞察力的读者。
找好用来考验人工智能的问题后,两人在业余时间潜心研究机器学习(machine learning)程序。有时,他们结束朝九晚九的本职工作,就在家中研究直到半夜两三点。钟伟峰打趣说,妻子曾抱怨他与陈子健通电话的时间,比他们夫妇俩聊天的时间还长。
高强度的工作不久后就被证明是值得的。几个月后,两人在陈子健的家中试运行程序,只采用《人民日报》文章的标题小试牛刀,结果让他们喜出望外。
“在1978年改革开放前半年,程序显示出很高的‘惊讶’峰值,明确显示出新政策出台前的舆论转向。”钟伟峰说,“当时高兴得要跳起来了。”
今年十月,他们将“政策变动指数”相关发现写成论文,发布在华盛顿智库美国企业研究所(American Enterprise Institute)的网站上。
人工智能读者的惊讶程度即是“政策变动指数”,该指数首度量化了官媒上传递的中国政策变化信息。而且,人工智能不受语言限制,类似的程序可以用来观察古巴、朝鲜、越南等苏维埃模式独裁国家的官方舆论导向。有研究朝鲜的专家已与两人探讨合作,通过以机器学习《劳动新闻报》分析朝鲜的政策方向。
人工智能读到了什么?
“政策变动指数” 的变动与多项中国近代重大政策的宣传时间吻合,它在1958年前录得了高指数,成功“预测”了大跃进政策。指数还显示,在1976年毛泽东去世后,中国的政策出现了几番波动,在1978年推行改革开放政策后恢复平稳。它还提前了三个季度测出1993年私营经济改革的加速,提前一年测出2005年的改革“减速”。
钟伟峰说,“和谐社会”在2004年的《人民日报》头版中反复出现,显示出政府酝酿在效率与公平之间取得平衡,预备市场改革减速。
人工智能如何解读习近平任内的政策呢?根据它的分析,习近平上台以来的政策与胡锦涛第二任期的相比“变化不大”。两位作者认为,这是由于习近平延续胡时期经济和社会改革并行的政策,市场经济改革虽然降速但仍在持续,同时,北京尝试采取一些民粹政策来解决社会问题。
值得一提的是,习近平任内的政策似乎让人工智能十分迷惑。在他执政的年份中,人工智能判断头版文章的准确度只有60、70%,表现只算是仅仅及格。
钟伟峰分析,近年来,当局既有“媒体姓党”、反西方意识的“七不讲”等意识形态偏左的政策,也出现“使市场在资源配置中起决定性作用”的偏右提法。“又左又右的政策之下,人工智能似乎还看不到一个统一的政策议程。”
另一段让人工智能程序迷惑的时期,是1989年天安门事件至1992年南巡期间。钟伟峰认为,这段时期内党内改革派与保守派分歧扩大,政策制定处于“比较迷失的状态”。
人工智能并非无所不能,对于政府不披露的消息,人工智能也无法猜出当局的心思。例如1966年发起的文化大革命与1989年的天安门事件,“政策变动指数”就没有提前显示出显著波动。
钟伟峰解释,文革前毛泽东未在官媒上提前显露他的意图,而在1989年,当局也有意低调报导天安门事件,而人工智能无法读出秘而不宣的政治议程以及不为人知的幕后派系斗争。
人工智能也无法预测突发事件,例如2008年金融危机后推行的四万亿投资计划,指数未能提前显示波动,只在计划宣布后录得高峰值。
偷懒的老师与高效的学生
人工智能是如何成长为一位具有分析和洞察力的超级读者的?
两位作者为人工智能程序提供了大量文章和简洁指令,让它自行判断这些文章中包含的信息是否足够重要登上头版。但就连他们都无法准确得知,人工智能是如何习得判断《人民日报》头版文章的分析能力的。
“我们相当于给人工智能提供200万个x与y的数据组,让它自己想出两者的关联。” 陈子健说。机器能够分辨褒贬义的词语,习得同义词与反义词,还能将文字内容转变成数字信息,判断每篇文章想要传达的涵义。
人类研究员与人工智能程序的关系,就像是偷懒的老师与高效的学生。老师交给学生200万道测验题与答案,即200万篇人民日报的报导及它们所在的版页。老师只给出少数的指令,例如要从左往右阅读、“共产党”等为专有名词词组,在这看似复杂深奥的研究中,全部代码不过3、4页长。接下来的事情,就放手交给人工智能学生自行思考。学生每做完一道测试题,就去对答案,若发现错误,就说明情况发生了变化。
“一般的研究中,失败的例子没有价值,但这个研究却正正是建立在失败的基础上,人工智能的错误显示了舆论转向,提示了政策变化。”陈子健说。
宾夕法尼亚大学传播学博士候选人方可成长期关注中国官媒在数字媒体时代的宣传手法,他认为,《人民日报》头版受政府宣传机关严格管理,相对于其他官媒及其他版块来说,采编偏好等因素造成的噪音干扰较少,用机器学习的方法能够得出相对有效的结果。
政治风险分析公司知险数据的联合创始人封楚诚对BBC中文表示,量化研究手法在政治分析中的应用前景广阔。“信息大爆炸的时代,人们肯定无法消化所有的资讯。大数据技术能在短时间内能摄取到大量的信息,还能将信息以标准化方式,例如数字,来呈现。”同时他也指出,量化过程中难免会丢失信息,不过这些损失的信息价值小于机器浓缩、整合信息的附加价值。
图片信息、领导人头像大小、文章位置、字体大小等信息就无法收录在这项研究中。人工智能也无法自动输出,具体是哪些词组或编排误导了它、导致了较高的政策变动指数。两位作者计划继续完善技术,另外将人工智能计算的频率从每季度一次增加为每月一次,他们将把最新发现收录在月度通讯中,与订阅者分享。
“这项人工智能程序并不能完全取代人,而是希望能够与研究人员互补。”陈子健说。就目前而言,“政策变动指数”还只能充当人类研究员的辅助工具。
在人工智能出错、 政策变动指数数值高时,人类研究员就能翻查人工智能判断错误的《人民日报》文章,进而分析这些错误是由何种政策转向引起的。
换句话说,人工智能在哪里跌倒,人类智能就从哪里介入。