以粤语语料标注与平台设计,全面启动2025年重点实验室任务
3月2日下午,粤语语料库建设与大模型评测重点实验室(以下简称“重点实验室”)主办的“AI-DimSum学术沙龙”第一期在广州大学荔湾研究院/研究生院会议室举行。本次沙龙的主题是“粤语语料标注与平台设计”,来自广州大学、暨南大学、华南师范大学、香港科技大学(广州)等多所大学的重点实验室骨干成员30余人参加,全面开启重点实验室2025年的科研攻关任务。
开场环节,重点实验室主任齐佳音教授介绍了“AI-DimSum”粤语语料库与开源生态建设计划,公布了“AI-DimSum”粤语语料库的标识。

△“AI-DimSum”粤语语料库标识
报告环节,暨南大学彭志峰老师系统介绍了“AI驱动的粤语地理分布数据系统”,通过智能技术实现粤语方言数据的动态采集与可视化分析,为语言资源保护提供新思路。李骜华研究员展示了多模态语料库平台的系统架构与平台集成的创新应用,涵盖AI Agents应用、私域搜索引擎设计及AI SaaS等,以构建AI友好型数据生态。广州大学博士研究生贾堃分享了多模态标注平台的开放共享方案。

△学术沙龙分享与研讨
研讨环节,重点实验室成员就粤语语料标注规则规范、粤语语料资源共建共享、语料库平台架构设计等展开了近三个小时的热烈讨论。

粤语语料库建设与大模型评测重点实验室由广州市社会科学界联合会与广州大学联合共建,旨在通过“粤语+人工智能”的文化科技融合创新,推动粤语传承传播与发展。实验室由中国工程院院士、广州大学方滨兴教授,香港科技大学(广州)党委书记、国家语言服务与粤港澳大湾区语言研究中心主任屈哨兵教授担任双首席科学家,广州大学网络空间安全学院齐佳音教授担任重点实验室主任。2025年3月,重点实验室正式进驻广州大学荔湾研究院/研究生院。
【供稿 粤语语料库建设与大模型评测重点实验室】
【编辑 张瑨欣】
【初审 罗欢】
【终审 禤健聪】