免责声明: 本网站所有内容均明确标注文章来源,内容系转载于各媒体渠道,仅为传播资讯之目的。我们对内容的准确性、完整性、时效性不承担任何法律责任。对于内容可能存在的事实错误、信息偏差、版权纠纷以及因内容导致的任何直接或间接损失,本网站概不负责。如因使用、参考本站内容引发任何争议或损失,责任由使用者自行承担。
广州相关问答
- 2026-01-31 59岁生日当天,王祖贤罕见发文:这些年安静也充实
中新网北京1月31日电“大家好,我是王祖贤,好久不见。”1月31日,退出演艺圈多年、久未公开露面的演员王祖贤在社交平台发文,讲述自己的近况。来源:王祖贤个人社交媒体。她说,这些年的日子,过得安静也充实。经营一家小小的艾灸...
- 2026-01-31 广州市书画名家公益惠民挥春活动举行
中新网广州1月31日电(记者张璐)伴随“粤韵千年·四海同心”2026广州新春灯会的启幕,“城市合伙·万福迎春”——广州市书画名家公益惠民挥春活动(简称“活动”)30日晚在越秀公园正门广场同步举行。活动现场,市民游客们携老...
- 2026-01-31 2025年完成跨区域人员流动量668.6亿人次
本报北京1月30日电(记者韩鑫)记者1月30日从交通运输部获悉:2025年,我国完成跨区域人员流动量668.6亿人次,同比增长3.5%。分方式看,铁路、民航客运量同比分别增长6.7%和5.5%,公路人员流动量同比增长3....
- 2026-01-31 广州去年侨助投资落地项目57个
中新网广州1月31日电(记者蔡敏婕)广州市委统战部31日发布消息称,2025年广州侨助投资落地项目57个,形成南科新能源产业园、侨港中加科技园、花都拉丁茂广场、国际华侨商贸文化交流中心等一批标志性成果。广州全市侨助经济高...
- 2026-01-31 广东佛山法院以高质量商事审判助力高质量发展
中新网佛山1月31日电题:广东佛山法院以高质量商事审判助力高质量发展中新网记者王坚方伟彬“标的额超亿元的涉港纠纷,没想到能通过调解圆满解决!”2026年伊始,一宗涉港金融借款合同纠纷的成功化解,成为广东佛山法院多元解纷工...
- 2026-01-31 育儿补贴已惠及3000多万名婴幼儿
本报北京1月30日电(记者曲哲涵)记者1月30日从财政部获悉:截至目前,全国已向3000多万名婴幼儿发放了育儿补贴。财政部会同有关部门采取一系列举措,畅通补贴发放渠道,加强资金管理监督,加快推动育儿补贴制度落地实施。20...
- 推荐搜索问题
- 广州最新问答
-

暗香疏影 回答于01-31

故人的歌 回答于01-31

稚气未脱 回答于01-31

2025年东莞地区生产总值12760.20亿元 同比增长4.0%
请叫我小平头 回答于01-31

雪夜孤人 回答于01-31

上不了岸的潮Ω 回答于01-31

宛若颜倾 回答于01-31

请你善良 回答于01-31

倾城歌女 回答于01-31

清明时节 回答于01-31
- 北京最新热搜
- 天津最新热搜
- 上海最新热搜
- 重庆最新热搜
- 深圳最新热搜
- 河北最新热搜
- 石家庄最新热搜
- 山西最新热搜
- 太原最新热搜
- 辽宁最新热搜
- 沈阳最新热搜
- 吉林最新热搜
- 长春最新热搜
- 黑龙江最新热搜
- 哈尔滨最新热搜
- 江苏最新热搜
- 南京最新热搜
- 浙江最新热搜
- 杭州最新热搜
- 安徽最新热搜
- 合肥最新热搜
- 福建最新热搜
- 福州最新热搜
- 江西最新热搜
- 南昌最新热搜
- 山东最新热搜
- 济南最新热搜
- 河南最新热搜
- 郑州最新热搜
- 湖北最新热搜
- 武汉最新热搜
- 湖南最新热搜
- 长沙最新热搜
- 广东最新热搜
- 广州最新热搜
- 海南最新热搜
- 海口最新热搜
- 四川最新热搜
- 成都最新热搜
- 贵州最新热搜
- 贵阳最新热搜
- 云南最新热搜
- 昆明最新热搜
- 陕西最新热搜
- 西安最新热搜
- 甘肃最新热搜
- 兰州最新热搜
- 青海最新热搜
- 西宁最新热搜
- 内蒙古最新热搜
- 呼和浩特最新热搜
- 广西最新热搜
- 南宁最新热搜
- 西藏最新热搜
- 拉萨最新热搜
- 宁夏最新热搜
- 银川最新热搜
- 新疆最新热搜
- 乌鲁木齐最新热搜


中新网广州12月7日电(记者许青青)第十届语言服务高级论坛暨2025年度国家应急语言服务团学术年会6日至7日在广州大学举行。粤语语料库建设与大模型评测广州市哲学社会科学重点实验室(下称“实验室”)研发的AI-DimSum粤语语料库平台在大会上正式发布,标志着粤语数字化发展进入新阶段。
粤语作为汉语的一种方言,在海内外有上亿用户,但在网络世界中却属于低资源语言。广州大学网络空间安全学院教授齐佳音介绍,该平台围绕“数字中文建设”和大湾区文化数字化需求,遵循“标准先行、数据可溯、服务可用”原则,构建了基于岭南文化、面向AI应用、兼顾研究与学习的多模态粤语语料数据生态系统。
据介绍,AI-DimSum多模态粤语语料库平台建设了语料采集子系统、语料标注子系统、大模型对接子系统、语料确权检索子系统、语料质量评估子系统、语料管理子系统以及应用商店子系统等七个子系统。通过子系统协同工作,实现从数据采集、清洗、标注、确权、存储检索,到模型接入与最终应用发布的一体化流程,为粤语语料库的构建、管理、利用与落地应用提供完整、模块化、可扩展的基础设施与运行机制。
AI-DimSum粤语语料库汇聚处理文本语料超过100万字,涵盖新闻、文学、社交媒体等领域;完成3000小时高保真语音标注及1TB以上的音视频资料,包括大模型训练专用语料集;功夫熊猫、小猪佩奇、哪吒、大圣归来、花木兰等包含粤语字幕与标注的动画影视作品;外来媳妇本地郎、溏心风暴等包含粤语字幕与标注的影视作品;超过1万句的多用途粤语生活场景音频+文字的语料;岭南文化图像素材10000张;构建了包含6669条权威词条、30000条扩展词条的粤语安全语料库;粤语大模型内容安全多模态评测题超过20万道等。(完)
文章来源:https://www.chinanews.com/sh/2025/12-07/10528697.shtml