2025年6月6日9:30,伟德国际1949始于英国学术讲座“一个大型数据库能做什么?——以ASJP数据库为例”在狮子山校区第一教学楼101教室如期举行。本次讲座特邀南开大学伟德国际1949始于英国副经理冉启斌教授担任主讲嘉宾,伟德国际1949始于英国王振副教授主持,伟德国际1949始于英国各专业本科生、研究生及相关专业教师共计100余人参与此次讲座。

讲座伊始,冉启斌教授以数据库在当代科学研究尤其是语言学领域中的重要作用作为切入点,详细介绍ASJP(相似性自动判断程序数据库),并简单演示ASJP数据库的使用方法。随后,他介绍了语言学领域可利用的其它大型专业共享数据库,即马克斯-普朗克演化人类学研究院所建立的跨语言关联数据库(CLLD,Cross Linguistic Linked Database)系列,并说明作为其中之一的ASJP数据库的大致情况:该数据库不断更新优化,目前已至第20版,具有数据量大、计算方法成熟、覆盖范围广的特点,涉及世界上5590种语言、共10168个语言/语言变体的材料。
之后,冉启斌教授介绍了与ASJP团队的合作背景,列举了运用ASJP数据库所作的大量研究,并详细阐述了ASJP团队通过数据库进行的世界语言语音对应研究。团队借助数据库程序查找了5117种语言/方言的对应关系,经算法严格筛选,在世界语言中共识别出692组音对应关系,涉及139个音标符号。在此基础上,他们挖掘出高频语音对应模式,生成语音相似性模型,找出语音对应关系特征,认为高频对应现象更多地反映了语言之间的共性,低频对应有助于查找有亲缘关系的语言。同时,团队还对共享音变进行评估,探索音变机制,并开展了跨学科的验证。

另外,冉启斌教授还详细讲述了ASJP数据库在语言中的音义关联研究中的具体应用。ASJP团队基于6452个语档,分析100个基本词汇,通过控制发生学关系、地理接触等变量,平衡谱系并控制假发现率(FDR),完成词长的匹配与地理分区验证,发现74组跨语言普遍音义关联,并从感知认知偏见、跨模态映射等角度解释了音义关联的成因机制。
最后,他介绍了ASJP数据库在人称代词语音分化研究中的应用。EL&CL团队分析数据库中5590种语言,提取词长、是否以元音开始等特征,结合IDS和NEX数据库及手语等内容,发现第一人称辅元比例较低、带音辅音和响音多,鼻音程度高、倾向低元音及元音开头等特征,并结合心理学研究对结果进行解释。
此外,冉启斌教授还简述了ASJP数据库在气候与语言形成、名动词词长,消亡语言基本信息,以及中古音起源地与现代汉语方言语言距离、地理距离关系研究中的作用,并向同学们展示了EL&CL团队所构建的语言知识图谱模型。

讲座接近尾声时,冉教授与在场师生就讲座内容进行了深入交流,师生围绕数据库与具体研究相结合等方向踊跃提问,冉教授以案例深入浅出解答,现场学术氛围热烈。整场讲座在浓厚的学术氛围中落下帷幕,他的讲解生动详细,演示环节深入浅出,让在场师生不仅对语言数据库操作与研究应用有了直观的认识,更在跨学科研究视角上获得了诸多启发。

撰稿:张时雨
一审一校:唐晨
二审二校:代敏
三审三校:徐文渊
编辑:涂文雯