《“互联网 教育”领域本体可视化构建与结构分析.docx》由会员分享,可在线阅读,更多相关《“互联网 教育”领域本体可视化构建与结构分析.docx(7页珍藏版)》请在第一文库网上搜索。
1、“互联网+教育”领域本体可视化构建与结构分析鲍婷婷陈丽郑勤华王怀波摘要“互联网+教育”是一个不断发展的创新领域,是教育高质量发展的必然选择。本体涵盖了某个领域语义网络的关键概念,可以客观反映特定领域的发展重点。研究以构建“互联网+教育”领域本体为主线,以剖析“互联网+教育”领域结构为重点,实现了 “互联网+教育”领域本体可视化与结构系统化。研究发现,“互联网+教育”领域具有“两级宏观一两级微观”的体系结构,宏观层面分为基础支撑、发展任务、动力引擎、保障体系四个维度,微观层面包括26个一级结构和53个二级结构。并进一步从夯实基础支撑、一、引言随着以互联网为代表的新兴技术与教育的深度融合,“互联网
2、+教育”已成为一个备受关注、快速发展的创新领域,为推动教育变革、解决教育主要矛盾等提供了新的思路与手段。近年来,政府部门陆续出台了 “互联网+教育”相关政策文件,大量“互联网+教育”理论与实践也不断涌现,在社会范围内形成了一股“互联网+教育”热潮。与此同时,“互联网+教育”的蓬勃发展带来了海量信息资源的迅速产生与积累,不仅加剧了信息爆炸与价值利用间的矛盾,也使得“互联网+教育”领域边界与结构愈发模糊不清,为深入认识“互联网+教育”内涵与特征带来了现实挑战。因此,对育”领域冒息的高效组织显实践者正确熬识与践行“互联网+教育,促进“互联网+教育”的持续健康发展。二、“互联网+教育”的内涵在国家“互
3、联网+”行动计划背景下,“互联网+教育”应时而生,成为教育改革创新的热点话题。2022年2月,教育部发布2022年教育信息化和网络安全工作要点,提出要发展”互联网+教育,实现教育信息化的转段升级3;2022年4月,教育部发布教育信息化2.0行动计划,提出到2022年建成“互联网+教育大平台4;2022年3月,李克强总理在政府工作报告中强调发展“互联网+教育,促进优质资源共享5;2022年,中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要首次肯创新的教育新生态9;三是教育变革的历史进程,“互联网+教育”是教育信息化的一个发展阶段,强调以学习者为中心,借助各类社会资源满足学
4、习者多样化与个性化学习需求,具有战略性变革意义10T1。综上所述,本文认为,“互联网+教育”通过新兴技术与教育的深度融合,推动新型教学模式、服务模式、组织模式、管理模式等深层次的体制机制变革,最终目标是重塑一个集基础研究、创新实践、政策规划于一体的开放、创新、动态的教育生态系统。三、“互联网+教育”领域本体构建“互联网+教育”领域本体的可视化构建过程共包含领域语料收集、领域概念识别、本体结构划分、本体关系识别、领会的项目申请书、2022年国际人工智能与教育大会发布的智能教育案例集、“互联网+教育创新沙龙的实践案例等为主要数据来源,筛选得到148个创新案例;在政策层“中华人民共和国中央人民政府”
5、 “中国教育信息化网” “中华人民共和国教育部”三个网站发布的政策文本为准,以“互联网+教育”“互联网+” “教育信息化”“教育现代化”为关键词进行检索(检索日期为2022年12月26日),筛选得到 201 份政策文本。B2F0871F-9F1C-4AD2-8ED0-ACADAFE6F5B0(二)领域概念识别获取恰当的领域概念是构建领域本体的一项关键任务。胡华认为,不同领域、不同主题存在不同的构词规律,并建立了UGC信息领域的构词规则12。周浪等发现,科技领域中99. 7%关键词的基本算法之一,其主要作用是评估一个关键词在语料库某一文档中的重要程度,可计算得到互联网教学(0. 10)等抽取概念
6、的重要性排序。其次,探究自定义词表的词性组合规律,形成“互联网+教育”领域的概念词性规则,如第一个词与第二个词均为名词(n),进而通过语法规则(n+n)获取双词概念如“数字教育资源”的词性标注结果为(数字,X),(教育资源,n)。两次概念抽取存在大量“噪音”词,建立人工剔除规则过滤后最终得到1001个概念。(三)本体结构划分抽取得到的领域概念集合是无序的、离散的,难以清晰地表征本体内部结构。因此,进一步通过聚类处理将领域概念划分为具有相似特征的子集,以从宏观视角挖掘“互联网+教育体系结构。研究采用经典的聚类算法一一K-Means,其具有操作简单、计算速度快、可解释度较强等优点。K-Means算
7、法的原理是把所有对象划分为K个子集,研究发现当K值等于9时,各个子集概念之间的差异性最明显,且每个子集内的概念相似度最高,故最终将领域概念划分为9个主题(见表1)。(四)本体关系识别领域概念间的关系主要用以表征概念之间的各类关联,从而建立起领域本体内部的组织结构。概念间的关系主要包括层次关系和非层次关系。其中,层次关系即上下位关系(Kind-of),而非层次关系表示层次结构以外的关系。研究依据“互联网+教育”领域语料文本的特点共定义了五种非层次关系:同义关系(Same-of)、属性关系(Attribute-of )整体与部分关系(Part-of)、并列关系(Equal-of)、实例关系(Ins
8、tance-of)o层次关系获取结合了相似度与细化度策略。首先,通过相似度计算获得具有相关关系的概念对;其次,通过细化度计算判断概念的深浅层次。通常情况下,上位概念包含的信息较少,细化程度较低,而下位概念包含的信息更多,细化程度也更高。经过细化度计算得到了 1868个概念对,进一步设置合适的阈值进行过滤,最终得到了 1121个上下位关系。与获取层次关系相比,非分类关系更加复杂和隐蔽,现有获取非分类关系的技术尚不成熟,因此,采用人工襟注的方法获取非分类关系,具体思路为:通过相似度计算获取相关概念对,过滤掉已通过细化度计算的分类关系概念对,进而将剩余符合条件的概念对依据实际关系命名。在人工标注非分类关系之前,先对两名研究者进行编码训练,并对其编码结果进行一致性检验,得到Kappa系数为0. 905 (p