教育部:加快建设国家语言文字大数据中心
封面新闻记者 粟裕
3月31日,教育部举行新闻发布会,介绍推进语言文字信息化发展情况。封面新闻记者获悉,《关于加强数字中文建设 推进语言文字信息化发展的意见》(简称《意见》)发布,其中明确加快建设国家语言文字大数据中心,以数字化技术动态监测、收集和分析语言文字事业发展、国家语言能力建设、重点规划实施、重大工程进展等核心业务数据,提高数据支持决策效率。

教育部新闻发布会现场。封面新闻记者粟裕摄影
《意见》强调,以国家语言资源服务平台建设为基础,带动地方语言资源平台建设。推动基础性语言资源建设,实施国家关键语料库共建共享计划,重点支持建设大规模中文语料库及高质量民族语言文字语料库、手语盲文语料库、行业领域语料库、语言监测动态语料库等。加快应用性语言资源建设,重点推进助力学校教育教学、文化传承发展的资源建设。
开展战略性语言资源建设,建设国家战略语言资源信息库,重点建设支撑国家安全与发展、服务共建“一带一路”等语言资源。强化特色性语言资源建设,重点推进中国语言资源保护工程数字化建设,开发利用好国家语言地图、中国语言知识图谱、中华精品字库等。
全面加强语言文字信息化体系建设。标准化是信息化的基础和前提。统筹推进语言文字基础性标准和信息化标准一体建设,构建覆盖全面、结构合理、科学可行的数字时代语言文字规范标准体系。以语言文字信息处理标准建设为基础,支持面向信息技术及人工智能领域的语言资源建设、管理、应用、共享标准研究,重点推进语料库、数据标注、数据评价等规范标准的制修订。推进大语言模型等基础术语规范化。制定手语和盲文的信息化标准。研制民族语言文字信息化标准。研制甲骨文数字化共享技术标准。
《意见》指出,建立产学研用协同培养语言文字信息化相关人才的机制,建设高水平人才队伍。依托国家语言文字关键研究领域领航计划,培养精通语言文字信息化建设的高层次紧缺急需人才。加强语言人才供需机制研究,支持高等学校语言学科与多学科深度交叉融合发展,加强“语言+人工智能”复合型人才培养。面向语言文字信息技术产业及未来发展方向,加强高素质技能人才培养。
此外,构建协同创新体系。加强科教融汇、产教融合、校企合作、校际合作,协同推进语言文字信息技术的科学研究、技术攻关、应用创新和产业发展。充分发挥地方、高等学校、职业学校、科研机构、行业企业、社会团体等协同作用,共建“数字中文”联盟,形成语言文字信息技术融合创新、共建共享和转化应用机制。探索国际科研合作机制,提升语言文字信息技术的理论研究水平、产业应用能力和社会服务效能。