直播访谈

广东省教育厅在教育部发布会上介绍推进语言文字信息化工作情况
文字实录
排序 字号 自动更新

教育部办公厅副主任、新闻办主任陈星

  各位记者朋友,大家下午好!欢迎出席教育部新闻发布会。

  今年是贯彻全国教育大会精神、落实教育强国建设规划纲要的关键之年。当前教育系统正在积极行动,凝心聚力推动教育强国建设高起点布局、高质量推进。我们也将通过多种方式及时发布介绍相关进展情况,欢迎记者朋友们关注!

2025-03-31 15:00:12

教育部办公厅副主任、新闻办主任陈星

  今天的发布会,我们聚焦落实教育强国建设规划纲要,全面推进语言文字信息化发展有关情况。

  大家知道,语言文字是人类智能发展、信息交流、思想表达、文明互鉴以及融入社会和联通世界的基础工作,也是国家重要的教育、科技、文化、经济、安全和战略资源。

  全方位释放语言文字在数字时代经济社会发展中的数据要素价值,对于服务教育强国、科技强国和文化强国建设具有重要意义。

2025-03-31 15:01:30

教育部办公厅副主任、新闻办主任陈星

  近日,教育部、国家语委、中央网信办共同印发了《关于加强数字中文建设 推进语言文字信息化发展的意见》,对加快推进以信息化促进语言文字事业高质量发展,以数字化赋能语言文字更好服务现代化建设等,作出了全面部署。今天的发布会也将对文件进行全面解读。

2025-03-31 15:02:55

教育部办公厅副主任、新闻办主任陈星

  出席今天发布会的嘉宾是:教育部语言文字信息管理司刘培俊司长,教育部语言文字应用管理司王晖副司长,广东省教育厅朱建华副厅长,北京师范大学康震副校长以及北京大学王选计算机研究所汤帜所长。

  首先,我们请刘培俊司长介绍推进语言文字信息化发展和数字中文建设有关情况。

2025-03-31 15:03:22

教育部语言文字信息管理司司长刘培俊

  谢谢主持人。长期以来,党中央始终高度重视语言文字工作。习近平总书记指出,“语言是人类交流思想的工具、传承文明的载体、增进理解的桥梁。中文是承载着中华民族数千年的文明智慧,是中国贡献给世界的重要公共文化产品。”当前,语言文字作为教育资源、科技资源、文化资源、经济资源、安全资源和战略资源,它的功能作用更加突出。语言文字服务经济社会发展,数据要素价值更加彰显,语言文字事业的基础性、全局性、社会性、全民性特点更加鲜明。

2025-03-31 15:04:49

点击查看更多
网友留言
自动更新

总台央视记者:刚才刘司长在解读《意见》的时候提到全面推进语言文字信息化,要以加强数字中文建设为重点。能否请刘司长对“加强数字中文建设”这方面的内容和考虑再做一些具体的介绍呢?谢谢。

[教育部语言文字信息管理司司长刘培俊]  感谢央视记者的提问。您关心的问题,事关语言文字信息化发展的总体布局和关键重点,也是我们研究政策、设计项目和落实好政策的关键和重点。去年以来,为科学谋划语言文字信息化发展和数字中文建设,我们开展了实地调研,包括部门会商以及专家论证,大家认为语言文字信息化的工作需要聚焦战略需求,加强科学统筹,特别是要统筹处理好全面推进和重点加强、服务人工智能制高点和建设优质语料新基建、语言数据赋能信息技术创新与信息技术赋能语言文字资源使用等若干重大关系。   关于全面推进语言文字信息化。要遵循语言文字事业的基础性、全局性、社会性和全民性特点,把握语言文字与信息技术所共有的泛在性特征,推进两者深度融合,全方位释放语言文字的数据要素价值,全环节发挥语言文字的资源功能作用,全领域推进语言文字服务经济社会发展,逐步形成推动语言文字信息化,特别是突出数字中文作为信息化建设重点的总体格局。   关于重点加强数字中文建设。当前数字中国建设的大背景和世界大语言格局,对承载中华文化的中文数字化提出新的要求。当前和今后一个时期,重点加强数字中文建设主要有以下考虑:一是中文使命任务重大。今后一个时期,中文服务数字中国建设,加大国家通用语言文字推广力度,深化中华优秀语言文化传承,增进语言文明国际交流互鉴等多项重大任务,更加需要中文数字化赋能。二是中文文化内涵丰富。中文承载着中华民族数千年的文明智慧,是中国贡献给世界的重要公共文化产品,更加需要中文数字化传播。三是中文使用范围广泛。中文是世界上使用人数最多的语言,是联合国六种工作语言之一,190多个国家和地区开展中文教学,85个国家将中文纳入国家的教育体系,更加需要中文数字化学习。四是中文数据价值突出。大规模、高质量的中文数据有利于推动中国特色大语言模型创新发展,更加需要中文数字化支撑。   《意见》明确提出重点加强数字中文建设,着力推进中文数字化与数据中文化、创新应用与规范安全、新型中文服务体系构建与语言文字治理体系的完善,进一步提升中文在全球数字空间以及人工智能等关键应用场景的使用占比和价值引领,进一步提升在全球语言治理框架中中文参与度和在世界文明交流互鉴中的中文贡献率,为教育强国、科技强国、文化强国建设发挥中文更大的作用。   谢谢。

中国网记者:我这个问题是提给汤所长的,在您刚刚的介绍中也提到了,上世纪中文信息处理技术解决了汉字进电脑、上网络的历史性问题,迎来从“铅与火”到“光与电”的革命。当前人工智能技术快速发展,加强数字中文建设在推动中文信息处理技术创新发展方面,您认为将会发生哪些重要的作用?谢谢。

[北京大学王选计算机研究所所长汤帜]  谢谢这位记者的提问。上世纪80年代,王选院士的团队发明激光照排技术,并结合汉字的编码标准,突破了中文数字化的空间限制,让承载中华文化的中文在全球互联网空间获得新生。当前,大语言模型技术对大规模高质量语料提出前所未有的需求,赋予了数据中文化新的历史内涵和使命任务。不同的历史阶段,类似的机遇和挑战。中文信息处理技术的发展从以往解决汉字输入输出的基础性问题,进阶到当先释放语言文字数据要素价值的全方位突破。我们认为,加强数字中文建设将从三个维度重塑发展格局,推动中文信息处理技术发展进入新阶段。   第一个方面,要从重要资源转化为数据要素价值。语言文字是国家重要的教育资源、科技资源、文化资源、经济资源、安全资源、战略资源。新形势下,语言文字将从实现“静态符号”向“动态数字资产”,从“信息载体”向“生产要素”的转型,要重点推动语料库、数据标注与评价等标准的研制,支持文本生成与理解、语言翻译、情感分析等各种任务。   第二个方面,要从广泛存在聚焦到关键领域应用。语言文字“日学而不察、日用而不觉”,广泛存在于社会生产各个方面。新形势下,语言文字将实现从符号存储到智能建模的质变,要聚焦关键垂直领域建设语料基础设施,构建支持大模型训练的高质量中文数据集。   第三个方面,要从基础支撑提高到赋能全局发展。当前,人工智能技术发展迅速,语言文字信息处理技术创新应用正经历从“GB2312字符集”到“万亿参数大语言模型”的范式变革。新形势下,语言文字将实现与信息技术的深度融合,要形成“技术突破—场景落地—生态繁荣”的良性循环,打造数字化引领品牌,有力服务教育发展、助力科技创新、赋能文化传承、推动产业升级、促进社会进步。   我的回答就到这儿,谢谢。

中国教育报记者:《教育强国建设规划纲要》提出,要建设“新型国家语料库”,《意见》也提出到2027年初步建成国家关键语料库。请问语料库在语言文字信息化工作中发挥什么样的作用,以及下一步我们有哪些推进安排?

[教育部语言文字信息管理司司长刘培俊]  感谢您的提问。加强新型国家语料库建设,是落实教育强国建设规划纲要、服务教育强国建设的重要任务,是建强国家关键语料基础设施的重要举措,是加强数字中文建设、推进语言文字信息化发展、推动语言文字高质量发展的基础支撑,也是经济社会信息化建设、数字化赋能和智能化发展的基础要素。   总体考虑是“聚焦一关键、统筹两手抓、夯实三基础”进行整体布局、分步实施、务求实效。具体的部署安排,要坚持战略牵引、需求驱动、应用为要,启动实施国家关键领域语料库建设计划。   一是聚焦“需求”这一关键。在关键学科、重点行业、战略区域、民生期待和社会急需领域,分批建设规范、安全、优质的国家关键语料库。目前,教育部、国家语委已经支持建设了30余项关键领域的语料库。   二是统筹 “夯实新基建”与“服务制高点”两手齐抓。以建设语料基础设施为新基建,服务大语言模型以及生成式人工智能等技术前沿创新应用的制高点。目前,教育部、国家语委已经支持布局了五个领域的自主安全可控大语言模型建设项目,下一步将根据需求稳步扩大建设范围,提升建设成效。 三是夯实“机制、标准、人才”三个基础。第一是逐步建立健全语料共建共享新机制,第二是研制语言资源、语言数据、基础语料以及大语言模型的技术和管理标准,第三是依托高校研究机构推进多学科交叉融合,为语言科技、语料建设以及人工智能创新应用培养高素质人才。 谢谢。

中国教育报记者:《教育强国建设规划纲要》提出,要建设“新型国家语料库”,《意见》也提出到2027年初步建成国家关键语料库。请问语料库在语言文字信息化工作中发挥什么样的作用,以及下一步我们有哪些推进安排?

[教育部语言文字应用管理司副司长王晖]  感谢中国教育报记者关注关心“新型国家语料库”建设。“新型国家语料库”建设应该说是在我们司参与研制《教育强国建设规划纲要》的过程当中,汇聚专家学者的意见建议,凝练语言文字支撑强国建设的战略支点过程当中谋划和提出的,并且写入了《教育强国建设规划纲要》。   当前以深度求索(DeepSeek)等为代表的人工智能技术创新不断取得突破性的进展,在这个大背景下,国家提出这样一个战略部署,建设新型国家语料库,凸显了其重要性、必要性和紧要性,我们应当积极统筹、广泛协同、大力推进。   现在在一些应用领域,主要是在语言的教育教学和研究领域,有多个语料库。但是很多语料库还处于单一文本模式和领域应用阶段,在建设的理念、技术和方法、规模,以及数据多样性、时效性尤其是与人工智能相结合的大规模应用方面还存在不足,难以满足多元化、动态化尤其是智能化的语言数据需求。   对此,我们总的考虑是:立足人工智能时代大背景,突破传统语料库单一文本模式和领域应用壁垒,以大模型训练及性能评测、智能计算为核心,以新质态、多模态、多语言、大规模、全域性为突出特性,为通用领域和细分领域多场景应用及创新发展提供规范、可信、高质量的语言文化语料资源。   2025年,我们司已经启动布局了新型国家语料库的建设工作,主要包括两方面:一是规范引领,主要是加强制度的供给,研制语料库建设规范,突出价值导向、应用导向、创新导向,统筹质量和安全,为语料库建设提供基础原则和方法指引。二是示范引导,成熟先上,开发建设“中华文脉新型语料库”“中华大阅读体系语料库”,以这两个示范库建设整体打造出标杆,“中华文脉新型语料库”也可以简单理解瞄准的是智慧教师,“中华大阅读体系语料库”瞄准的是智慧学伴。在此基础上,探索建设系列教育、语言文化国家新型语料库群,服务教育强国、文化强国建设。   谢谢。

新华社记者:近期,DeepSeek等大语言模型方兴未艾,面对新形势新要求,想请问高校如何发挥人才培养的主力军作用,在加强数字中文建设新背景下高质量建好中文专业?

[北京师范大学党委常委、副校长康震]  谢谢这位新华社的记者。确实,最近DeepSeek模型引起了国内外的广泛关注和热议。正像怀进鹏部长在十四届全国人大三次会议“部长通道”上面所讲的,DeepSeek模型引发的关注和热议,让我们看到了教育改革和发展的重大机遇。北京师范大学目前正在按照《教育强国建设规划纲要(2024—2035年)》的部署,以完善人才培养与经济社会发展需要适配机制为导向,统筹推进学科布局、机构建设和人才培养,提升中文专业学生的人文素养、数字素养和职业能力,高质量建好中文专业。具体来讲,我们在三个方面作了一些工作。   一是着力推进学科的深度交叉融合。今年北师大结合国家重大战略需求和人才发展的需要,推进文学院与人工智能学院、国际中文教育学院、外国语言文学学院共同合作,推出了“汉语言文学+人工智能”双学士学位培养项目,这个计划今年就要启动招生。下一步,学校还将继续支持中国语言文学学科与其他学科深度的交叉融合,促进形成新的学科增长点和新的科学研究范式,打造学科融合的新优势。   二是着力推进科研机构纵深建设。目前为止,学校依托中国语言文学和语言学等“双一流”学科建设“中国文字整理与规范研究中心”、“汉字汉语研究与社会应用实验室”等多个教育部和国家语委的科研平台,将学术研究与经济社会需求结合,促进研究成果的广泛应用。下一步,我们还将坚持“四个面向”,完善科研平台的体系建设,强化有组织科研,支持技术突破创新,锻造卓越师资团队。   三是着力推进人才培养机制创新。从去年开始,北师大积极实施“人工智能+高等教育”的教育教学改革专项“1228计划”,这个计划是什么内容呢?就是在3—5年的时间里,促进10个专业人才培养与人工智能的深度融合,打造20个人工智能赋能教育教学的重点团队,推动20本数字化的教材建设,建设80门深度融合人工智能的智慧课程。未来,北师大还将持续重视抓好新文科建设,优化人才自主培养体系,加大科教融汇力度,深化产学研用一体化合作,加快培养适应新技术、新产业、新业态、新模式的复合型人才。   谢谢,我的回答就是这样。

全部网友留言 我要留言
测试音频

00:00/00:00