学界动态

联系我们

地  址:兰州市南滨河东路522号

邮政编码:730030

电  话:0931-8866013

传  真:0931-8415026

电子邮箱:dhyj1983@163.com

印  刷:兰州新华印刷厂

国内发行:兰州市报刊发行局

国外发行:中国国际图书贸易公司

北京399邮箱

学界动态

您目前所在的位置:首页>>新闻公告 > 学界动态 >

2018敦煌研究发展研讨会发言稿(九)文博领域的数字人文及其发展

时间:2018-12-20 09:49:34 来源:《敦煌研究》编辑部 作者:张加万 点击:

g16.png


数字人文(Digital Humanities,DH),是在新兴技术尤其是信息技术支撑下开展人文研究而形成的新型跨学科研究领域。

早期的人文计算发端于文学、语言学、历史学等领域,这些领域的专家更倾向于对文学与历史工作使用计算,例如从著作或作家全集的重要字词索引、以及统计分析。其中人文学中运用计算机的起点可以追溯到计算机发明之初,1949年耶稣会学者罗贝托•博萨与IBM合作使用自动化技术历时三十年编制了《托马斯著作索引》,创造了由计算机生成的托马斯•阿奎那作品索引。

伴随人文资料的数字化及其网络分享,20世纪60年代以来,人文学者开始越来越频繁和深入地使用各种新型的数字技术处理人文资料, 数字人文从文学及语言学领域向历史、音乐、艺术等领域扩散,例如扫描古籍图书、使用虚拟技术复原古建筑模型和历史上的都市,开发和建设各种在线的音视频数据库等。2004年,美 国学者苏珊•施赖布曼 (Susan Schreibman )等⼈首次提出 “数字人文”的概念。2009年学者们还发布了“数字人文宣言 2.0”。2015年 ,国际数字人文组织联盟 (The Alliance of Digital Humanities Organizations) 诞生,成为当时的热门话题。20 世纪 90年代末和21 世纪初,数字人文工作是定量研究,主要是提升数据库的搜寻和检索能力、基于自动化语料库的语言学分析等。其工作重点是大规模数字化项目和技术基础设施的建立。过去10多年,数字人文工作是关于定性、解释、经验、情感和特征生成,核心方法是利用数字工具产生的巨大的研究动力,创造一系列学术生态环境和生产工具,这里就包括例如文博领域的数字展览、导览、数字文创等。

与数字人文存在千丝万缕联系的是计算社会科学, 2009 年2月,哈佛大学、麻省理工学院、密歇根大学、纽约大学等世界一流大学的15 位顶尖学者在《科学》上联合发表题为《计算社会科学》的论文。其中信息科学领域的作者有6 位,其他作者分别来自工程、管理、艺术与科学、政治、经济、历史、社会学、生物社会学等学科方向,包括社会学领域著名学者盖瑞•金 (Gary King) 教授和信息科学领域的学者艾伯特 - 拉斯洛•巴拉巴西 (Albert- László Barabási) 教授等。该文的发表为“计算社会科学”的发展奠定了基础。

    当前数字人文研究主要借助文本分析挖掘、地理信息系统(GIS)、语料库、信息可视化方法、互动游戏、多媒体、虚拟现实、增强现实甚至是及其学习等在哲学、史学、文学、语言学和社会学等学科的应用。图书情报领域的古籍数字化研究、档案馆、图书馆、博物馆领域的元数据、语言学家各种语料库建设等都是典型和重要的数字人文研究。在这一进程中, 随着原生数字(Born-digital)人文资源的增加(如数字地图、计算机图像、在线网页、虚拟人物等),它们的产生极大地丰富了人文研究的对象,同时也对数字人文的定义及发展产生了深刻影响。

数字人文也好,计算社会科学也罢,其本质是在信息时代,人文社会知识的获取、分析、集成和展示所形成的数字化场景,彻底改变了人文社会科学学者们进行资料组织、标引、检索、分析利用的习惯,打破了传统意义上人文学、社会科学、艺术学和自然科学自文艺复兴以来形成的界限,为当前和今后人文社会科学与自然科学都提供了新的研究范式及知识生产模式。

随着人文社会科学面临的数据规模的不断增大,现代人文学科正像自然科学领域业已发生的那样,快速地向可计算化方向发展,变成数据驱动型研究。这其实就是“基于数据的研究”,即第四研究范式(过去人类的研究只有三种方法:理论、实验和计算机仿真,现在有大数据分析,即数据密集型研究或者e-science),从而使得人文社会科学研究成为了数据科学。

在数字人文研究方法学层面也开展了一些有益的探索,例如美国数字人文专家约翰•安斯沃斯(John Unsworth)的工作,他提出数字人文活动具有的特性可以用七个“学术原语(Scholarly primitives)”来概括, 也就是常用的七种基本方法,分别是“发现(Discovering)、注释(Annotating)、比较(Comparing)、参考(Referring)、抽样(Sampling)、说明(Illustrating)和表示(Representing)”。该理论后来被欧洲学者Tobias Blanke和Sheila Anderson等规范为五个基本研究方法:即发现(Discovering)、收集(Collecting)、比较(Comparing)、发布(Delivering)和协作(Collaborating)”。

    信息技术的不断发展也为数字人文研究提供了有力支撑,以扫描、拍摄、采样、捕捉、图形设计、3D 建模等为代表的文物数字化技术,以及以文本编码、语义描述、本体建模、数据库设计、多媒体搜索、语义搜索、名称实体提取(NER)、API数据服务等的数据管理技术,以文本分析(词频、共现、关联、向量、概率),聚类分类,主题分析,内容挖掘,时序分析,地理空间分析,社会关系分析等的数据分析技术,以信息美学,知识地图,主题图,关联呈现,场景模拟,历史仿真等的信息可视化技术,以VR/AR 技术、脑机界面,认知技术,互动测量,游戏化学习,计算机竞技等的人机交互技术,以自动分类,图像视频音频识别和分析,个性化服务,精准推送,深度学习,超级计算,机器绘画,机器作诗等的机器学习技术,为数字人文研究搭建了基础设施,提供了数字人文研究所需的素材、工具和交流平台,同时也必然带来数字人文在宏观上的整合和一体化现象,而在内部形成问题跨界、学科融合和工具共通的领域特征。

数字人文在文博领域获得了长足发展,主要可以分为:

1) 数字人文在史学研究中的最直接体现是史料数字化和数据库建设。最典型的是将实体文献扫描为数字文献,并通过数据库来集中揭示。比如哈佛大学和北大合作开展的“中国历代人物传记资料库(CBDB)”。

2) 考古学者还可利用数字人文技术进行三维虚拟遗址绘图、文物虚拟复原、色彩还原等工作。

3) 中国博物馆领域的智慧博物馆。

4) 大规模文物的数字化为代表的数字人文项目,例如数字敦煌计划等。

5) 虚拟现实(Virtual Reality, VR)、增强现实(Augmented Reality, AR)文博的虚拟展示。虚拟技术进行场景重建一直都是数字人文的重要应用,如石窟二维和三维重建、古建筑的BIM建模等。“虚拟故宫”、日本开发的“虚拟京都”;利用增强现实技术,很多博物馆开始使用诸如Hololens等MR设备进行虚实结合的博物馆参观体验,文物导览诠释等工作。

6) 内容的智慧化:一个例子是山西省博物院的文物知识图谱项目。

7) 服务的智慧化:一个例子是是中国博物馆逐步得到推广应用的智能导览系统。

    数字人文研究正在兴起,在技术方法的强劲支持和推动下,数字化、数据化、可视化、个性化、智慧化交融正在生发日新月异的变化,值得及时关注,以参与和促进数字人文的创新。