今天上午,在海州区教师发展中心参加第八届中国语言智能大会。
在会上,我有幸聆听了国家语委中国语言智能研究中心主任周建设的学术报告《语料奠基,科技赋能:推动人智能赋能区域教育高质量发展》。
本次报告围绕人工智能赋能区域教育高质量发展,从国家人工智能战略切入,提出规范语料建设是AI赋能教育的核心基础,介绍了国家规范语料库的建设框架、遴选方法与落地路径。
一、数字时代的人工智能国家战略与项目背景国家人工智能战略目标:国务院《人工智能+行动计划》提出明确硬指标:2027年智能体应用覆盖率超过72%,2030年超过90%。
云课堂教学智能系统是典型的教育领域智能体应用。项目研发背景:云课堂智能教学系统依托三个国家级重大项目联合攻关:1.科技部2030人工智能创新项目;2.国家社科重大项目;3.国家语委重大项目。核心方向是攻克语文作文智能评课,同时扩展到文科简答题的智能批改评测,覆盖政治、历史等文科科目。
重点:大模型通用AI与垂直领域专用AI存在代差,通用大模型类似全科医师,专用智能体才是专科医师,垂直领域教育应用大概率无法被通用大模型直接替代。项目成果基础:1. 拥有目前国内规模最大的语文教学资源语料库,中文作文评测语料资源为全球独有;2. 依托三支专业团队:国家语委中国语言智能研究中心、中国人工智能学会语言智能专委会、由5位院士领衔的17名博士+5名博士后研发团队;3. 成果获得吴文俊人工智能科技进步一等奖(中国人工智能领域最高奖,被称为中国图灵奖),区域实验获得省级教学成果特等奖,目前已在全国近百所示范学校落地应用。
二、语料奠基:规范语料库建设的必要性与框架设计通用大模型的核心缺陷:当前通用大模型存在严重幻觉问题,顶级大模型幻觉率可达31%以上,部分应用错误率超过40%,不符合教育对内容准确性、规范性的要求,因此教育领域必须建设规范的专用语料库。三类规范语料库框架(根据课堂图片补充):1. 国家知识规范库:整合全学科基础知识与生活常识,覆盖13大学科(哲学、法学、文学、历史学、理学、工学、农学、医学、军事学、管理学、艺术学、经济学、教育学)加16种生活常识,概括为“衣食住行行,教医工耕,文娱体景,家国贤民”,构建完整科学的知识图谱。2. 国家人文基因语料库:从中华传统文化与历代文献中提炼出忠、孝、悌、达、和、信、勤、勇、廉、术、法、智、道、仁14个核心人文基因,作为立德树人的内容核心,为素养教育提供规范语料支撑。3. 认知培养库:支撑个性化阅读与认知能力发展,本次优先落地中华大阅读体系语料库,采用“知识+素养”双驱动建设模式。“三标”实施策略(根据课堂图片补充):以国料(基础)为依托,以国谱(结构)为抓手,以国标(标准)为先导,构建三位一体的实施体系,最终实现“国家有谱、治国有数、强国有本”的战略目标。
三、中华大阅读语料库的建设方法与定位科学定位:以三大科学理论为指导:知识基因学、知识能量学、知识认知学,强调选书需要学科均衡发展,反对过度偏向文科阅读,要求基础教育阶段覆盖全部13大学科的入门阅读,同时根据不同年龄段的认知水平确定合理阅读量。入库内容采用三级专家遴选机制,优先加强理工科院士参与遴选,平衡学科结构。技术定位:采用前沿核心技术:1. 重点:人文基因智能计算技术,可以从文本中挖掘作者的隐藏情感、人性与写作意图,解决文本评价的主观性问题,这是通用大模型无法实现的垂直领域核心技术;2. 个性化标配知识推送:根据学生现有阅读结构,自动补充失衡领域的推荐阅读,促进学生知识结构均衡发展。产品定位:基于规范纯净的基础知识,构建人机交互的阅读服务产品。建设流程:专家按标准遴选→专业人员标注→形成结构化语料→多模态呈现(文字、音频、视频、图片四种形态,区别于传统纯文本语料库)。
四、学科知识遴选:主体意图鉴别法(根据课堂图片补充)按照不同学科的核心主体意图,确定遴选的核心方向。
学科核心主体意图:
哲学:求真。
经济学:谋利。
法学:立规。
教育学:启智。
文学:写意。
史学:叙事。
理学:解构。
工学:创造。
医学:治疗。
农学:植养。
军事学:攻防。
管理学:调控。
艺术学:炫情。
重点:该方法大道至简,可快速把握不同学科的核心价值,为基础教育入门阅读选书提供清晰标准。五、平台建设与落地路径(根据课堂图片补充)现有平台框架:中华大阅读国家语料库平台设置六个核心板块:首页、文库、视界、图鉴、知行、分享,目前已收录超过1200本精选图书,采用三层架构+AI智能推荐,支持10秒到5分钟的短视频内容呈现,提升学生阅读兴趣与信息获取效率。落地推进计划:在全国东西南北共建区域示范基地,逐步扩大覆盖范围,最终为全国教育提供规范、纯正的AI训练语料与阅读资源,带动教育教学模式改革。
报告时间虽然只有半小时,但干货满满,一时也消化不完。姑且录下,待来日与实践再有效对接。