当前位置: 首页   >   学术动态   >   正文

AI-DimSum学术沙龙第六期:智能语音与文化精神标注

发布日期:2025-04-23

AI-DimSum学术沙龙(六)

声纹织就粤韵经纬:

智能语音与文化精神标注


4月20日,由粤语语料库建设与大模型评测重点实验室(以下简称“重点实验室”)主办的“AI-DimSum学术沙龙”第六期在广州大学荔湾研究院/研究生院举行。来自北京、广州、香港等地的多位人工智能、语言学、教育等领域专家学者齐聚一堂,在数字浪潮与千年粤韵交融的语境下,以粤语语料库建设为核心议题,围绕智能语音合成、文化精神标注等关键技术领域展开深入探讨与思想碰撞,为岭南文化的数字化传承与创新性发展镌刻出虚实共生的时代注脚。


undefined


技术研讨环节,重点实验室团队重点围绕粤语语料库平台开发进展与挑战展开探讨。粤语语料库平台研发团队阐述了平台的开发进展,涵盖电子词典、多模态检索功能扩展及多语料数据结构适配方案等内容;数据标注技术团队则汇报了协同工作的情况,提出从标注平台的优化和流程的标准化两方面着手提升语料处理效率。


学术报告环节,广州大学胡勇军老师系统展示了“智农粤语”AI影视配音技术成果,重点实验室团队通过构建粤语语音视频生成技术路线,攻克多角色区分与情绪表达两大难题,实现了从语音合成到情感识别的全链条技术突破,该技术目前已在农业短视频制作、同声配音等多个实际场景中落地应用;中国社会科学院大学博士研究生黎顺苗则聚焦面向岭南文化精神标识的语料标注工作,提出搭建三层框架的创新想法:基础语言层新增文化标签体系—文化表征层建立精神特质分类—元数据层完善地域属性标注,并针对粤语分词标准化不足、字符编码缺失等问题,提出采用规则标注与深度学习相结合的解决方案,通过自定义词典扩充和预训练模型微调提升语料标注准确率。


图片


自由讨论环节,暨南大学吴南开老师在黎顺苗博士报告的基础上,提出“轻语法、重文化”的优化方向,他指出,在粤语语料标注工作中词性标注可适度精简,将更多精力聚焦于文化语义单元的深度挖掘。重点实验室主任齐佳音教授则从技术实践的角度出发,建议重点实验室技术团队加快语料入库进度,形成“先走通、后规模”的发展路径。


此次沙龙明确了重点实验室未来将推进两项核心工作:一是确定多层级文化标注方案,优化现有标注体系,从而提升语料处理效能;二是深化高校与产业端合作,探索基于粤语语料库的数字人在文旅等场景的实际应用。


粤语语料库建设与大模型评测重点实验室由广州市社会科学界联合会与广州大学联合共建,旨在通过“粤语+人工智能”的文化科技融合创新,推动粤语传承传播与发展。实验室由中国工程院院士、广州大学方滨兴教授,香港科技大学(广州)党委书记、国家语言服务与粤港澳大湾区语言研究中心主任屈哨兵教授担任双首席科学家,广州大学网络空间安全学院齐佳音教授担任重点实验室主任。2025年3月,重点实验室正式进驻广州大学荔湾研究院/研究生院。



【供稿 粤语语料库建设与大模型评测重点实验室】

【编辑 张瑨欣、马翠怡、周子寒】

【初审 罗欢】

【终审 禤健聪】

Copyright © 2024 广州大学荔湾研究院(研究生院) 版权所有
地址:广州市荔湾区西堤二马路37号文化公园广州十三行文化科技中心二楼

Copyright © 2021 广州大学岭南文化艺术研究院 版权所有
地址:广州市大学城外环西路230号行政东楼前座646、648  邮编:510006