AI-DimSum学术沙龙(四)
AI智守岭南乡音
3月30日,由粤语语料库建设与大模型评测重点实验室(以下简称“重点实验室”)主办的“AI-DimSum学术沙龙”第四期在广州大学荔湾研究院/研究生院举行。20余名粤港澳大湾区专家学者围绕粤语语料库平台建设等议题展开研讨,探索方言传承与科技融合新路径。

技术筑基:
多模态平台助力语料库生态建设
技术探讨环节聚焦粤语语料库平台的产品设计、技术架构与功能优化。重点实验室技术团队报告了粤语语料库平台产品设计的近期进展,展示了已经完成的智能搜索引擎DimSum,以及集成智能标注与数据共享的粤语语料多模态标注共享系统架构。重点实验室的核心产品粤语语料库平台AI-DimSum将构建“产学研用”协同生态,推动粤语语料从静态保护向“活态应用”升级。
学术探索:
方言大模型凝炼岭南文化精神标识
学术报告环节,香港科技大学(广州)唐靖博士介绍了“方言大模型端到端交互系统”,该系统能够实现粤语语音直转文字、实时对话及数字人互动,支持九种方言混合解析,识别准确率较主流平台提升20%。广州大学刘荣艳博士提出融合AI技术构建“粤语+民俗+器物”数据库,建设“岭南精神标识体系”,激发年轻群体文化认同。

生态共建:
版权治理与轻量化应用并进
自由讨论环节,广州大学贾堃博士提出建立“分层开源”机制,激励高校、民间共享语料。与会专家学者围绕粤语影视、歌曲资源版权合规、“AI粤语导师”与“听歌学方言”等轻量化应用开发展开热烈讨论,旨在推动学术成果普惠大众。
粤语语料库建设与大模型评测重点实验室由广州市社会科学界联合会与广州大学联合共建,旨在通过“粤语+人工智能”的文化科技融合创新,推动粤语传承传播与发展。实验室由中国工程院院士、广州大学方滨兴教授,香港科技大学(广州)党委书记、国家语言服务与粤港澳大湾区语言研究中心主任屈哨兵教授担任双首席科学家,广州大学网络空间安全学院齐佳音教授担任重点实验室主任。2025年3月,重点实验室正式进驻广州大学荔湾研究院/研究生院。
【供稿 粤语语料库建设与大模型评测重点实验室】
【编辑 张瑨欣】
【初审 罗欢】
【终审 禤健聪】