AI-DimSum学术沙龙(三)
深度推进粤语语料库平台建设
3月23日,由粤语语料库建设与大模型评测重点实验室(以下简称“重点实验室”)主办的"AI-DimSum学术沙龙"第三期在广州大学荔湾研究院/研究生院举行。沙龙由重点实验室负责人齐佳音教授主持。来自多所高校的专家学者、重点实验室科研骨干和产业界人士共同参与了此次线上线下结合的学术交流活动。

沙龙第一个环节围绕粤语语料库平台的技术进展展开深入讨论。暨南大学彭志峰老师和千语街技术总监唐日新详细介绍了其线上语言教育平台的技术架构与功能设计,重点展示了粤语资源和教学设计的实现逻辑,包括视频、对话、单词解释、录音跟读等功能模块的设计思路。重点实验室陈丹薇、李骜华、雷峥嵘三位研究员分享了平台业务逻辑、语料库搜索引擎以及粤语语料库平台数据库的设计进展。
在沙龙的第二个环节,暨南大学吴南开博士从多模态粤语标注的角度,深入分析了方言字编码规范与多模态标注中的技术挑战及解决路径。华南师范大学博士研究生谈日星介绍了语言资源标注领域的相关国家标准。
会议还特别邀请了参与"挑战杯"项目的本科生李卓欣,分享粤语使用现状的调研发现及其团队在粤语学习推广中的实践成果。
两个环节之后,与会者展开了热烈的自由交流与讨论。整个沙龙活动持续了四个多小时,与会者依然意犹未尽。

粤语语料库建设与大模型评测重点实验室由广州市社会科学界联合会与广州大学联合共建,旨在通过“粤语+人工智能”的文化科技融合创新,推动粤语传承传播与发展。实验室由中国工程院院士、广州大学方滨兴教授,香港科技大学(广州)党委书记、国家语言服务与粤港澳大湾区语言研究中心主任屈哨兵教授担任双首席科学家,广州大学网络空间安全学院齐佳音教授担任重点实验室主任。2025年3月,重点实验室正式进驻广州大学荔湾研究院/研究生院。
【供稿 粤语语料库建设与大模型评测重点实验室】
【编辑 张瑨欣】
【初审 罗欢】
【终审 禤健聪】