□河南广播电视台记者王肖晖 宋雨 志强
今天上午,纪念甲骨文发现120周年国际学术研讨会在位于河南安阳的中国文字博物馆开幕,这是甲骨文发现以来首次在国家层面举办的系列纪念活动之一。
开幕式上,甲骨文大数据平台首次发布。在现场,主持人宣布,“殷契文源”作为全球唯一的甲骨文大数据平台,从今天上线开始向全球免费开放。
我们知道,在已经发现的5000多个甲骨文字中,明确破译出1500字,还有3000多字,考释难度极大。为此,2016年,中国文字博物馆发布“悬赏公告”,称破译未释读单字奖励10万元,可谓“一字千金”。据中国文字博物馆副馆长魏文翠介绍,目前已经破译出一个半字,发出了15万奖金,破解这些甲骨文字,不仅需要查阅大量资料,反复论证,还要有一个好记性。
而从2016年开始建设的“殷契文源”甲骨文大数据平台,其在整合甲骨文字、著录、文献等基础数据基础上而进行的人工智能技术的辅助研究,将为识别新的甲骨文字提供另一条途径。“殷契文源”甲骨文大数据平台建设者、甲骨文信息处理教育部重点实验室主任刘永革说,“缀合”技术为甲骨文字研究提供新的路径:“‘缀合’就是‘拼合’,碎片拼成完整的。原来都是专家拼合,要脑子记住所有的这些碎片才能拼。我们现在就靠计算机技术拼,我们已经拼了13片了,其中有2片是专家还没拼出来,我们计算机拼出来了。”
甲骨文大数据平台建设指导者、中国社会科学院甲骨学殷商史研究中心主任宋镇豪告诉记者,这是个开放的平台,人人都可以进入这里检索资料。“殷契文源”甲骨文大数据平台主要包括三库一平台,一个是甲骨文字库,这是“殷契文源”的核心,目前已发现的约16万片甲骨片中,已经有约十万片甲骨片录入;另一个是甲骨文的著录库,有280多部,已经录入246部;再一个是甲骨文文献库,已录入两万多篇甲骨文研究文献。建设这个平台的目的就是通过甲骨文研究资料数字化,服务甲骨学研究,提高甲骨学研究的进度。
显而易见,今天正式上线的“殷契文源”甲骨文大数据平台为甲骨文研究进入智能化时代提供了数据支持,也标志着甲骨文研究步入'云时代'。