粤语迈向数字化:新AI平台守护岭南文化
用科技守护粤语
在广州大学近期举办的语言服务论坛上,研究人员揭幕了一项非凡成果——AI-DimSum平台,这座保存粤语文化的数字方舟。对于全球数百万人使用的方言而言,这项计划的推出恰逢其时。
粤语为何重要
广州大学网络空间安全学院齐家银教授解释道:"粤语不仅是交流工具——更是岭南文化的活态脉搏"。尽管使用广泛,粤语在数字空间的代表性仍显不足。AI-DimSum项目通过为这一鲜活语言传统创建完整生态系统改变了这一现状。

图片来源说明:该图像由AI生成,图像授权服务提供商为Midjourney。
数字点心盒内有什么
该平台提供七大集成系统,处理从数据采集到实际应用的各个环节:
- 语料收集汇集真实粤语素材
- 标注工具确保精准语言学标记
- 模型集成连接研究与实际应用
- 权利管理保护文化遗产
- 质量控制维持学术严谨性
- 应用商店提供即用型资源
成果令人瞩目——字面意义上的。研究人员已整理:
- 超100万字涵盖新闻、文学及社交媒体内容
- 3000小时精细标注的音频记录
- 超过1TB影音资料包括《功夫熊猫》等字幕经典作品
- 10000+日常会话实例
- 10000张岭南文化图像的视觉宝库
该平台不仅记录粤语——更通过伴随许多人成长的流行媒介让这门语言鲜活起来。
文化保护遇上尖端科技
在中国南方地区数字化转型浪潮中,这个项目的时机恰到好处。它既确保粤语在日益互联的世界中保持声音,又为以下领域提供宝贵资源:
- 研究方言演变的语言学家
- 开发粤语工具的AI工程师
- 传承文化遗产的教育者
- 维系代际联系的家庭
团队更注重实际应用而非纯学术研究。正如齐教授指出:"我们正在搭建祖辈教导孙辈与开发者创造未来语言应用之间的桥梁"
该项目体现了广州大学服务区域需求与贡献全球语言多样性的双重承诺。


