当前位置: 首页   >   学术动态   >   正文

粤语语料库建设与大模型评测重点实验室工作研讨会召开

发布日期:2025-04-15

4月8日,由广州市社科联指导、广州大学主办的“国家语言服务与粤港澳大湾区语言研究中心学术活动暨粤语语料库建设与大模型评测重点实验室(下称“重点实验室”)工作研讨会”在广州大学大学城校区召开。广州大学副校长李进,广州市社科联党组书记、主席崔颂东,香港科技大学(广州)党委书记、国家语委科研机构国家语言服务与粤港澳大湾区语言研究中心主任屈哨兵教授,重点实验室成员及广州大学人文学院师生参加会议。


会议报告环节由广州大学人文学院院长禤健聪教授主持。李进在致辞中指出,希望通过今天的活动,能够进一步推动多学科交叉融合,探索具有中国特色、岭南风格的城市文化传承与发展之路,为大湾区的语言研究和文化传承贡献更多力量。


△广州大学副校长李进致辞


会上还举行了国家语言服务与粤港澳大湾区语言研究中心研究员聘任仪式,并正式启动重点实验室2025年度研究课题。重点实验室主任齐佳音教授受聘为国家语言服务与粤港澳大湾区语言研究中心研究员,并担任语言服务产学研促进部主任。


△国家语言服务与粤港澳大湾区语言研究中心研究员聘任仪式



△重点实验室2025年度研究课题启动仪式


齐佳音教授在会上介绍了重点实验室2025年第一季度的工作进展:一是语料库平台建设方面,确定了开源生态的SaaS技术架构,在粤语语料库“AI-DimSum”系统底座和系统上层全面启动了开发工作,完成了语料库数据库结构设计、搜索引擎开发以及语料库平台的产品化设计,上线了重点实验室官网https://aidimsum.com/,在语料标注系统开发方面也取得了实质进展;二是基础研究方面,在粤语文化精神标识体系以及粤语语料标注规范等方面都取得了阶段性进展;三是整体运行方面,AI-DimSum学术沙龙常态化进行,大湾区粤语语料库创新联盟进入筹备期,粤语语料库开源社区开始为重点实验室贡献资源,与产业机构的粤语语料共享共建有序推进,各项工作开展都非常顺利。重点实验室的研究工作得到了暨南大学、华南师范大学、香港科技大学(广州)、澳门大学等大湾区高校大力的支持,也得到了广州市大湾区现代产业研究院、广东人民出版社、电子五所等产业机构的大力支持,“1+1+N”的发展模式效用凸显。下一阶段,重点实验室将持续推进粤语语料库平台的集成性建设,推动重点实验室研究课题产生的语料以及社会各界共享语料的入库。



△齐佳音教授介绍重点实验室2025年第一季度工作进展


研讨环节,暨南大学汉语方言研究中心研究员彭志峰首先介绍了暨南大学数字人文平台的建设经验。重点实验室指导专家、暨南大学汉语方言研究中心主任刘新中教授指出,粤语语料库要从正字、正音等方面做到学理基础扎实,暨南大学汉语方言研究中心在汉语方言研究方面有深厚积累,可以和广州大学优势互补,共同建设好粤语语料库,实现合作共赢。此外,刘新中教授还呼吁破解高校跨学科人才培养的机制难点,促进语言学与信息技术学科的加速融合。重点实验室指导专家、暨南大学汉语方言研究中心前主任甘于恩教授则强调了粤语语料库的国际包容性,要充分体现大湾区以及国际其他粤语使用区域的认可度和接受度。



△重点实验室指导专家刘新中教授发言


△重点实验室指导专家甘于恩教授发言


会议总结环节,崔颂东书记指出,重点实验室应锚定“建成国家文化大数据体系”的目标,发挥粤港澳联动优势,为语言资源保护提供“广州经验”。屈哨兵教授建议,要深化粤港高校协作,抓住人工智能带来的机遇,巧干加实干,扎实推进重点实验室各项工作,力争早日取得标志性成果。



△崔颂东书记进行会议总结


△屈哨兵教授进行会议总结


△会议现场


粤语语料库建设与大模型评测重点实验室由广州市社科联与广州大学联合共建,旨在通过“粤语+人工智能”的文化科技融合创新,推动粤语传承传播和发展。实验室由中国工程院院士、广州大学方滨兴教授,香港科技大学(广州)党委书记、国家语言服务与粤港澳大湾区语言研究中心主任屈哨兵教授担任双首席科学家,广州大学网络空间安全学院齐佳音教授担任重点实验室主任。2025年3月,重点实验室正式进驻广州大学荔湾研究院/研究生院。



【供稿 粤语语料库建设与大模型评测重点实验室】

【编辑 张瑨欣、周子寒】

【初审 罗欢】

【终审 禤健聪】

Copyright © 2024 广州大学荔湾研究院(研究生院) 版权所有
地址:广州市荔湾区西堤二马路37号文化公园广州十三行文化科技中心二楼

Copyright © 2021 广州大学岭南文化艺术研究院 版权所有
地址:广州市大学城外环西路230号行政东楼前座646、648  邮编:510006