数字赋能中国民族史自主知识体系构建
来源:中国民族报 山东大学东北亚学院教授 苗威 发布日期:2024-05-07浏览(10)人次 投稿收藏

  汗牛充栋的文献、遍布全国的遗址遗存,是构建中国民族史学科体系、学术体系、话语体系的基础,也是我们探源中华民族的宝贵资源。在数字文明造福人类的今天,运用人工智能等现代科学技术,在相关传统资料精准数字化的前提下,独立自主地构建中国民族史知识体系具有重要意义。

  其一,时代发展的必然要求。中国是统一的多民族国家,中华文明是世界上唯一没有中断的文明。在数字化转型与发展过程中,要重视实现民族史相关资源数字化。数字孪生、元宇宙等先进的技术手段,使客观的研究资源得到更加广泛的利用:通过数字化采集,比如利用光学字符识别技术(OCR)将采集的文献图像转变成文本,再对文本进行命名实体标注和实体关系建构,形成细粒度数据;利用网络地理信息系统(WebGIS)和遥感技术(RS)建构人文地理知识地图系统,对地理空间内的遗址、文物、地名变迁等数据,进行分类、分级、分层管理。在拥有历史厚度、地理精度、数据信度的情况下,对中国民族史进行基于传统知识的现代建构,从而回应时代之问。

  其二,学科建设的重要内容。在先秦典籍中,对各民族有着翔实的记载。《大戴礼记·五帝德》中,记载了舜时居于南、北、东诸边疆的民族;从《史记》至《清史稿》诸正史中,对边疆各民族有专门的书写;其他编年、典志等文献中,也蕴含着丰富的相关资源。传统研究所依凭的“故纸”,在当代被转换为数据,完备的数字体系推动中国民族史研究更加科学。而充分运用数字技术建构中国民族史知识体系,也是当代讲好中国故事的基础工作。

  其三,提高数字人文水平的应有之义。数字技术的发展给传统研究以及应用带来了巨大动能,然而这个动能的受力面并不均衡。一些发达国家数字化转型起步早,数据生产能力与规模也较为可观。相比之下,中国的数字人文水平与其存在一定差距。用古汉语书写的典籍是中华瑰宝,也是研究各民族发展历史的基础。但具有国际影响力的“中国历代人物传记数据库”(CBDB)、“中国历史地理信息系统”(CHGIS)等平台皆是由海外发展或赞助的,我国至今仍然缺乏独立完成并运行、能够与之比肩的平台。尤其是ChatGPT等生成式人工智能大模型的出现,其所输出的“知识”往往存在隐性渗透,使中国民族史知识体系面临新的挑战。

  中国民族史拥有丰富的材料,具备建构完善知识体系的充分条件,但这一工作任重道远。信息技术的发展和大数据时代的到来,为中国民族史研究提供了更多可利用的数据资源与技术平台,文献的获取途径、研究的方法手段、观点的表达方式、学术成果的传播途径等得到了重大更新与改善。运用现代技术构建中国民族史自主知识体系,可以从以下两个方面展开工作:

  一方面,传统文献是构建中国民族史自主知识体系的基础与源头,但相关文献来源广泛,数据结构多样。要做好精确数据的生产,自主制定数据体系和数据标准,确保知识智能化生产的源头坚实可靠。在此基础上,促进不同文献资源的统合、不同类型数据的融合、不同专题平台的整合,扎实做好数据的基础建设。

  另一方面,要加强历史学、民族学以及计算机科学与技术等多学科交叉融合,协同攻关,实现数据权属向知识自主的有机转化。开发中国民族历史大语言模型,用科学数据实现正本清源,铸牢中华民族共同体意识。运用检索增强生成技术(RAG)解决人工智能在应用层面的弱点,比如“人工”环节因史观与东西方话语殊途所造成的对“智能”的主观引导,“智能”疏离“人工”导致其自说自话等问题,有效提升国际传播力。

  (本文系山东大学东北亚学院教授苗威在“新时代中国民族史研究的新任务与新使命”专题研讨会上的发言摘登)

(编辑:王琪

[字号: ]


网站声明
本网站是国家民委主管的大型公益性网站,所收集的资料主要来源于互联网,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,不构成任何其他建议也不具有任何商业目的。如果您发现网站上内容不符合事实或有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
电话:010-82685629 电子邮箱:zgmzb@sina.com
感谢您对我网的关注!

最新新闻

专题

更多>>
  • 扎实开展党史学习教育
  • 中华民族共同体研究
  • 学习贯彻党的十九届五中全会精神