一、RDF文档解析器及查询语言的实现(论文文献综述)
于鸿飞[1](2020)在《检务公开人机交互场景下的语义理解》文中认为目前,自然语言处理技术快速发展,在金融、医疗健康等领域,得到了越来越广泛的应用,但是在检务领域研究较少。为实现新技术与检察实务领域的深度融合,最高人民检察院提出了探索推进检务公开实施方式、打造智慧检务的目标。本文旨在探索自然语言语义理解在检务公开领域人机交互模式下的创新应用,针对现有语义理解架构中未考虑问句中的深层语义关系、过分依靠关键字匹配的弊端等问题进行改进,主要的研究工作和创新点包括以下三个方面。(1)基于BERT模型的中文分词研究。BERT模型作为一种新的语言表征模型,可以引入丰富的上下文信息并通过微调的方式快速有效的构建中文分词模型。本文在BERT模型的基础上,针对检务公开活动场景的特点,采用序列标注的方式进行中文分词,并设计了法律领域词典和中文姓名词典特征的引入方法,以提升分词模型在法律领域上的分词性能。两种方式分别将F1值(加权调和平均值)在基准分词模型基础上提升了1.1%和2.6%。使最终的分词模型在法律文书数据集上的分词效果相对于常用分词工具有较好的提升。(2)基于图的语义依存分析研究。语义依存是一个融合了语义角色标注和句法分析的联合模型,不在受限于语句表面的句法结构,可以获取深层次的语义依赖信息。本文采用基于图的思想以双层Bi LSTM(双向长短时记忆网络)算法为核心构建了中文语义依存分析模型,并在此基础上设计了在模型中融入法律语料的BERT嵌入向量以及建立法律词语依存关系词典两种方法,来提升模型的性能。实验表明,在检务公开问句集上,可以将LF(弧标签F值)在基准解析模型基础上分别提升1.02%和1.19%。(3)SPARQL查询语句构建方法研究。对于RDF框架构建的知识库,SPARQL可以进行高效准确的检索,不需要理解特定于领域的关系或类型,即可获取该数据和询问相关问题。本文以查询三元组为核心,通过对检务领域问答对的研究和分析提取出简单的抽取规则,将语义依存结构解析成查询三元组列表,并根据策略转换成SPARQL查询语句,查询语句可以用于检务公开领域法律知识图谱或者法律知识库的检索查询。本论文依托于最高检国家重点研究项目展开研究,通过中文分词、语义依存分析以及SPARQL语句等技术实现对检务咨询问句的语义理解架构,实验结果表明,该架构能够从语义角度有效的将咨询问句转换为SPARQL查询语句,不仅在检务公开活动场景下为用户提供了高效获取答案的新方式,也为后续项目的研究奠定了良好的基础。
彭潇[2](2019)在《课程及教学大纲的本体构建及其在语义搜索的应用》文中认为随着互联网科技的发展,网络新技术在社会的各个领域产生了重大的影响,衍生了很多将网络技术融入到教育领域的研究,语义网和本体论技术在教育领域的应用,已经用于发明各种学习实体的语义模型。课程和教学大纲在教育组织中提供了重要信息并在学习活动和教育过程中发挥重要作用,然而,国内尚未有任何关于课程以及教学大纲内教育实体的本体概念化表示的研究。为了实现基于课程和教学大纲的智能服务,需要将非结构化的文本转化为设计良好的语义模型,语义建模是知识重用与共享的基础,也是知识进行管理的关键。本论文通过对高等教育课程和教学大纲中的概念和实体进行语义标注,构建了课程和教学大纲的本体,并应用于课程和教学大纲相关知识的语义搜索。论文主要从三个方面展开研究,研究内容包含以下三个部分:(1)基于ECS的课程和教学大纲本体构建方法针对课程和教学大纲领域知识的结构和特点,如课程知识繁多、教学大纲以非结构化文档存储的特点,传统的本体构建方法不能很好的解决以上问题。本文在传统本体构建方法的基础上,通过融合骨架法和七步法提出了一种本体构建方法(Educational Curriculum and Syllabus,ECS),该方法在处理课程和教学大纲知识结构方面有一定的优势,并成功构建完成了课程和教学大纲本体。(2)基于推理机、SWRL规则与SPARQL查询的课程和教学大纲本体评价标准理论验证根据构建完成的课程和教学大纲本体,基于Protege工具定义相关规则及使用推理机对本体进行一致性验证;编辑SPARQL查询语句通过查询结果对本体进行完整性、有效性验证;通过本体文档化对本体进行可重用性验证。(3)基于课程和教学大纲本体的语义搜索设计实现ECS语义搜索系统对课程和教学大纲本体进行实证研究。系统运用HanLP依存句法分析树构建语义查询图算法,解决传统搜索基于关键词检索返回结果不准确的问题,使用余弦相似度算法在返回检索结果同时推荐语义相似问题,丰富系统功能。
尹强[3](2019)在《基于本体的MVC架构模式识别及重构技术》文中研究表明随着软件系统的不断演进,软件系统会变得越来越复杂,软件设计的变更和文档的缺失导致维护人员越来越难以理解软件系统,维护成本也变得越来越高。针对这样的软件系统,开发人员需要对其进行重构。最基本的重构是代码重构,代码重构能够解决软件源代码在结构上的不良设计等问题,但是代码重构不能解决软件在架构层面上的问题,不能够有效地提高软件的性能。因此出现了架构重构,架构重构旨在解决软件在架构层面上出现的各种坏味道,架构重构的关注点是架构各个模块之间的依赖结构信息,没有关注软件各个模块之间的功能信息,架构重构有可能会导致软件功能的变化。因此需要面向模式对软件进行重构,软件架构模式从功能的角度描述了软件架构,面向模式进行重构的前提是要了解软件系统的架构模式,因此需要进行架构模式识别。MVC架构模式是软件架构模式的一种,在web信息系统和桌面应用程序中应用得十分范围广泛,对于MVC架构模式进行识别和重构是有价值的。本文主要研究MVC架构模式识别和重构,MVC架构模式识别是前提,MVC架构模式重构是落脚点,重构的开展是基于MVC模式识别结果,最终的目的是使得软件朝着健康的方向演进,降低软件维护的成本。本论文的主要工作包括:(1)针对特定目标系统的MVC架构模式进行模式识别。模式识别方法是基于本体,首先构造可复用的MVC架构模式本体,然后针对特定目标系统进行信息提取,利用提取的基本信息结合MVC架构模式本体构造特定目标系统本体,最后针对特定目标系统本体采用推理机进行本体推理,获得模式识别结果。(2)针对特定目标系统进行基于MVC模式识别结果的重构。首先根据MVC架构模式应用规范生成重构需求,其次在重构需求的基础上结合模式识别的结果生成重构方案,重构方案包括重构点的获取、重构方案的实施以及重构点实施后的有效性验证,有效性验证主要是采用人工的方式在特定目标系统中实施重构方案的具体操作,通过对比前后MVC架构模式图的变化来检测重构点是否消失,从而验证重构方案的有效性。(3)针对基于本体的MVC架构模式识别和重构技术实现了MVC架构模式识别和重构原型工具,包括业务逻辑、数据库、可视化三大模块的设计与实现,最后在原型工具上对优秀开源软件进行实验与分析,验证MVC架构模式识别和重构技术的有效性。
乔波[4](2019)在《基于农业叙词表的知识图谱构建技术研究》文中研究指明自从2012年Google推出知识图谱以提高其搜索质量以来,知识图谱作为人工智能的重要核心技术得到了迅速发展。知识图谱能够有效地提高搜索引擎的搜索质量和问答系统的准确率,已被广泛应用于智能搜索、智能问答、个性化推荐等领域。目前,国内外许多学者都在研究领域知识图谱的构建工作并取得了一定的研究成果。构建知识图谱主要包括知识体系构建、知识获取、知识融合、知识存储、知识推理和知识应用等几大步骤。本文以构建农业知识图谱为研究目标,利用《农业科学叙词表》、循环神经网络模型、条件随机场模型、集成学习、实体关系联合抽取模型、BERT模型等理论和方法,开展了农业知识图谱的模式构建和知识获取研究。论文的主要研究工作总结如下:(1)基于叙词表的农业知识图谱构建方法研究。目前大多数知识图谱构建都是基于维基百科、百度百科等公共资源,抽取概念本体、实体及关系,针对这些公共资源中农业领域知识缺少的问题,提出了一种基于叙词表的农业知识图谱构建方法。研究了叙词表到知识图谱模式层的自动转换规则,以及叙词表到知识图谱数据层的自动构建规则,完成了从《农业科学叙词表》到农业知识图谱的自动构建,最终实现了一个初步的农业知识图谱,该图谱具有6万多个农业叙词实体,以及21万多条由叙词实体、关系组成的三元组。研究结果表明,基于叙词表构建农业知识图谱的方法具有可行性和可靠性。该方法为农业知识图谱的构建提供了一条新思路,也为农业知识图谱的扩展奠定了高质量的数据基础。(2)基于集成学习的农业实体识别模型研究。目前实体识别模型都使用句子截断方式构建模型输入,针对这种方式会丢失句子与句子之间上下文信息的问题,提出了一种基于集成学习的农业实体识别模型ELER。为了训练ELER模型,构建了农业实体识别数据集AgriNER2018,该数据集标注了“沉积物”、“成土过程”、“土层”3种类型的实体,分为训练集和测试集2部分。训练集包含1528个句子,71736个字符,1229个实体。测试集包含231个句子,10242个字符,127个实体。与BILSTM-CRF模型相比,ELER模型在农业数据集AgriNER2018上精确度提高了2.32%,F1值提高了2.92%,在CoNLL2003标准数据集上精确度提高了1.37%,F1值提高了0.7%。结果表明,ELER模型能够有效提高实体识别的结果,且在AgriNER2018上提升更加明显,说明该模型在数据集欠缺的农业特定领域可以进行应用。(3)基于BERT预训练的农业实体关系联合抽取模型研究。目前实体关系联合抽取模型都使用Word2vec模型来训练词向量,针对Word2vec模型不能对多义词建模的问题,提出了一种基于BERT预训练的农业实体关系联合抽取模型BERT-BILSTM-LSTM。为了训练这个模型,构建了农业实体关系抽取数据集AgriRelation2018,该数据集标注了“水果”、“地理位置”2种实体类型和它们之间的“产地”关系,分为训练集和测试集2部分。训练集包含1348个句子,1161个关系实体三元组。测试集包含187个句子,133个关系实体三元组。与LSTM-LSTM-Bias模型相比,BERT-BILSTM-LSTM模型在农业数据集AgriRelation2018上F1值提高了2.8%,在NYT标准数据集上F1值提高了3.3%。结果表明,该模型克服了不能对多义词建模的缺陷,能够基本满足农业领域关系抽取的要求。(4)农业知识图谱构建与应用系统的设计与实现。综合应用上述研究成果,构建了农业知识图谱构建与应用系统,实现了叙词查询、实体识别、关系抽取、实体查询和关系查询等功能。系统的运行验证了上述研究方法、模型和算法的有效性。
汪小飞[5](2019)在《基于本体的事件驱动架构模式识别与重构方法研究》文中提出架构模式是根据已知问题的解决方案来解决相似的软件架构设计问题。通过识别软件架构模式跟踪软件演化过程中软件架构的变化,对软件演化过程中发现的架构模式使用不规范的地方进行重构,消除软件架构设计中的不规范,对于软件架构的可持续演进有很重要的意义。事件驱动架构是一种当下非常流行的架构模式,是一种以事件为媒介,实现组件或服务之间最大松耦合的方式。识别事件驱动架构模式并对识别结果中发现的违背事件驱动架构模式使用规范的重构点进行重构对于理解和维护事件驱动系统有着重要意义。本文主要工作和成果包括:i.设计了基于本体的事件驱动架构模式识别模型。通过本体实例层描述要识别的目标系统的程序依赖关系,通过本体概念层描述观察者模式及事件驱动架构模式,通过本体推理和查询获得要识别的目标系统中的事件驱动架构模式实例。ii.设计了以事件驱动架构模式实例识别结果为基础,根据事件驱动架构模式规范进行重构点定位,并对重构点生成重构方案的事件驱动架构模式重构模型。iii.基于所设计的模型,设计和实现了相应工具,并完成了模型实验和工具测试。本文测试了50个开源项目来展示事件驱动架构模式识别结果,并选择了两个事件驱动系统(工具识别结果为事件驱动架构模式且人工分析结果也为事件驱动架构模式的开源项目)通过人工分析来展示事件驱动架构模式实例的识别结果,以查全率和查准率两个指标验证事件驱动架构模式识别的准确率。同时,对实验案例中的事件驱动系统进行重构验证实验,通过使用原型工具对实验案例重构点定位,生成重构方案,以重构点定位的准确性、重构方案的重构成本率和重构方案的有效性三个度量指标验证基于事件驱动架构模式识别结果的重构方法的有效性。
王宁[6](2019)在《基于分布式技术的配电网全网数据建模研究》文中认为配电网建模对维护配电网数据库、潮流计算、短路计算、网络重构等具有重要意义。配电网与能源管理系统网络不同,其特殊的结构和/应川软件的具体要求决定了其具有数据量大、分布广、模型复杂等特性,因此有必要对配电网建模进行专门的研究,以适应配电网的研究与发展的需要。随着科技和信息的进步,电网中的电力数据采集设备也愈加多样化,采集的数据量也在飞速增加,数据量庞大且数据格式不统一,对电网中各系统的信息共享和数据交互造成了很大不便。因此,如何借助大数据技术来处理和分析配电网模型具有重大的意义。本文首先分析了国内外电网数据建模技术的研究背景和发展现状。简要介绍了 IEC 61970标准以及CIM模型,CIM提供了一个通用的电力系统模型。接着介绍了 XML和XML解析技术,并对比分析了常用的XML解析器;然后介绍了分布式和大数据相关的技术,其中HBase是底层依赖Hadoop的HDFS存储模型的分布式数据库,在处理大数据时具有高效性、灵活性和可扩展性。本文还研究了 CIM/XML拓扑分析和导入技术,使用Dom4j实现了 XML文档解析工作。最后,本文设计并实现了配电网全网数据建模系统,重点介绍了电网模型合并方法和全网数据模型建立的过程,并使用SVG技术实现了可视化操作,设计并实现了两个变电站的模型合并实例,验证了配电网全网模型的可用性。
杨丹[7](2019)在《时态RDF(S)的自动化构建与存储方法研究》文中提出在信息技术领域内,时间作为描述数据变化过程的基本维度,是诸多应用程序的重要组成部分。Web是现代信息共享与交互的基本平台,由于用户可以在任意时刻对数据进行编辑与发布,因此网络数据通常具有较高的动态性和时效性。长久以来,时态信息的表示和存储管理都是各项科学研究的重点,其中XML(Extensible Markup Language)作为主要的数据传输和存储语言,相关的时态扩展已经获得较广泛的研究。然而随着人工智能时代的来临,用户对网络的要求已经不仅仅局限于数据共享,人们对网络提供智能数据分析与处理的要求愈加强烈。但是目前使用的网络标准Web 2.0缺乏数据语义的描述,数据的内涵信息必须人工解读,提供智能化服务更是举步维艰。语义Web的出现与发展为此带来了解决方案,其采用的资源描述框架RDF(Resource Description Framework)及模式RDF Schema(统称为RDF(S))能够强有力地表示数据间的语义,从而加强机器对数据的理解,促进人与机器的协同合作。与此同时,语义Web领域内的时态数据处理研究也从未间断过。二十世纪初学者就提出了RDF(S)的时态扩展方案,并给出了具体的蕴含规则及语义推理方法。为促进Web信息语义化进程,本文关注于基于时态XML的时态RDF(S)自动构建,并在观察到时态RDF(S)数据呈指数增长的情况下,研究了基于分布式数据库HBase的时态RDF(S)存储,具体研究内容如下:(1)分析时间维度,提出时间域的表达方式与计算方法。依据选取的时间维度,提出时态RDF(S)、时态XML与XML约束规范XML Schema模型的形式化定义,并且给出时态XML与时态XML Schema的应用方式。(2)在时态模型定义的基础上,分别提出基于时态XML Schema和时态XML文档提取时态RDF Schema和时态RDF实例的映射规则及映射算法,并且设计实现相应的构建原型系统,验证映射方法的有效性与可行性。(3)分析HBase的数据模型与物理结构,提出HBase内置时间模型中存在的问题。并根据时态RDF(S)的数据特性,提出基于HBase的时态RDF(S)存储模型。该模型不仅能够有效存储具有时态特征的RDF数据,并且能够快速响应所有TriplePattern以及层次信息的查询。此外,本文针对该存储模型提出了相应的时态RDF(S)查询方法,并利用LUBM(Lehigh University Benchmark)数据集进行查询实验与结果分析。
王新阳[8](2018)在《面向语义描述与数据查询的大数据组织方法及其关键应用技术研究》文中指出大数据、物联网等技术的普及和深入发展促使数据不仅在体量上急剧膨胀,数据的种类和格式也在快速增加。各种数据由于在模式以及操作方式上的不同而形成众多独立的数据种群,不同类型的数据无法统一查询和处理,阻碍了数据之间的互通。这不仅使得各种数据的统一高效使用成为一件很困难的事,也为如何从这些海量数据中充分挖掘出有价值的信息带来了极大的挑战。而使用传统的方式存储和操作这些异构数据已经越来越难以满足当前应用需求,例如No SQL等大数据模型往往没有固定的模式,数据结构经常处于动态变化之中,是与传统数据进行融合的最主要障碍。目前关于大数据与传统数据模型进行模式集成的研究仍然不够充分,且大数据的语义描述等问题也尚缺少全面的研究。因此,需要一种统一、高效且足够灵活的方式来描述各类异构数据,且能够表达数据内部以及异构数据之间的语义,实现数据内在价值的挖掘和潜在知识的发现。本文在充分比较、分析各种异构数据集成公共模型的基础上,吸纳了相关主要模型的特点和优势,提出了一种面向概念与关系的公共数据模型GDM(即格数据模型,Grid Data Model)。GDM模型在关系、段、节等定义的基础上实现了一种新的数据模式定义和结构组织的方式,能够统一描述各种数据结构和语义关系。文中同时给出了GDM模型的形式化标准定义。为了深入说明GDM模型的语义描述和逻辑推理能力,本文在GDM基本概念的基础上描述了GDM模型的语义推理和领域知识演化原理,并以()描述逻辑为例,描述了如何通过GDM语法子集建立与描述逻辑的映射关系,以及如何利用GDM模型构建基于描述逻辑的本体知识库,并对GDM模型的相关推理问题进行了理论证明。本文接着研究了数据集成过程中数据结构异构的问题。为了实现各种传统数据模型与大数据模型的集成,本文利用GDM模型基于关系的数据结构描述机制,从形式化理论角度研究了各种数据模型向GDM进行模式转换的原理,包括结构化的关系模型、半结构化的XML和多种非结构化的No SQL数据数据模型。同时还研究了GDM模型能够同时描述有模式数据和无模式数据的混合模式特性以及进行动态修改数据的能力。本文然后基于虚模式定义了GDM模型代数以及查询语言GDM SQL的语法,并阐述了GDM数据查询过程和查询优化基本原则。以上GDM模型数据管理方案提供了格数据查询和操作的基本方法,是进行基于GDM模型的异构数据集成的必要前提。基于以上模型定义、相关理论和查询操作语言,本文研究了分布式环境下异构数据集成过程中的查询、处理和优化等若干方面,解决了查询变量关联、查询分解与查询计划生成、查询处理过程的并行调度等相关问题。同时,为了降低异构数据查询处理的时间成本,本文还提出了几种基于最小调度连通图的查询优化方案,通过模拟实验比较了各种优化策略的性能,验证了查询优化方法的有效性。为了进一步说明GDM模型的优秀特性和数据集成时的效率优势,本文还从各方面比较了GDM及几种基本数据模型的相关特性,并重点与OWL模型进行了深入对比。同时,还基于本文提出的效率评估模型,从时间和空间两个角度比较分析了各模型进行数据创建、修改、删除等操作时的时间与空间效率。结果表明,GDM在数据集成时其时间和空间效率相对于所比较模型总体来讲是最优的,非常适合异构数据集成。最后,本文设计了基于GDM模型的异构数据集成系统,介绍了系统的设计框架和实施过程,展示了系统的运行情况,验证了本文所提出的相关理论的可行性和有效性,显示了GDM模型能够比较出色地胜任分布式异构环境下的数据集成和知识发现。
谢兰[9](2018)在《基于CDQ的油田开发数据质量研究》文中研究表明随着信息化的发展,数据呈现爆炸式增长,数据质量问题也越来越突出。为了保证数据能够提供有效信息,数据质量的保障工作成为了企业的重要任务之一。面对各种各样的数据质量问题,大多数企业都结合业务需求开发了专有的数据质量管理系统,但是这些系统大多数没有给出数据质量维度以及约束规则的规范化表示,因此迫切需要解决数据质量的规范化、标准化问题,油田企业也不例外。同时,如何描述定义在实例层上的约束规则以及模式层上复杂的约束规则也是目前研究的热点之一。除此之外,由于国际上倡导开放数据的理念,与其他数据关联以获取比较权威的数据、结构或者其他必要描述,也将有效的提高数据质量。为了解决上述问题,首先,本文对国内外数据质量维度、约束规则、数据质量管理框架的发展历程以及数据质量评估技术进行研究,为以后的研究提供理论支撑。其次,研究关联数据技术为解决数据关联问题提供依据;再次,针对目前数据质量评估模型存在的不足,结合上述研究的先进技术和实际需求,参照斯坦福大学提出的七步法,提出一种新的构建数据质量管理元本体的方法,构建了与领域无关的通用数据质量管理元本体。在构建元本体的过程中,引入CDQ(Comprehensive methodology for Data Quality management)框架,为构建元本体提供整体理论架构;在语义层面,引入本体技术以对数据质量有关概念进行规范化,并对复杂和实例层的数据质量约束规则的描述问题进行解决;为了解决数据之间的关联性问题,引入关联数据技术,利用URI标识资源。然后,在已构建的数据质量管理元本体的基础上,提出了基于SWRL规则的数据质量管理推理,实现对数据质量隐含知识的推理。最后,以油田开发为背景,进行了数据质量管理系统的设计与实现。该系统实现了数据质量管理元本体的解析和维护、约束规则和清洗规则的维护、基于SWRL规则推理,并在推理的基础上进行质量评估和数据清洗,验证了所提出的基于CDQ油田开发数据质量研究的有效性和技术可行性。
赵重威[10](2018)在《面向开放链接数据的知识库管理系统设计与实现》文中提出语义网是W3C提出的一种智能网络的设想,其目的在于使机器能够理解词语和概念,网络上的语义网数据多以开放链接数据集的形式发布。在开放链接数据的基础上,人们使用知识库存储知识,开发各种智能应用。但是现有的知识库管理方案,多数是像传统数据库一样对数据进行简单的增改删查,并不能完善地支持语义网标准,并且缺乏管理模式知识、处理语义关系的能力。本文的目的是设计和实现一种面向开放链接数据的知识库管理系统,为知识工程以及各种知识库应用提供一种有效的知识存储和管理方案。该系统面向结构化和非结构化的开放链接数据,用图数据库Neo4J作为本体数据库,用Virtuoso作为底层RDF数据库,分离存储链接数据的模式层和数据层,提供本体库的自动化管理服务,支持SPARQL、语义查询等多种查询方式。深入分析语义网技术标准和本体工程的一般问题后,本文在现有知识库存储方案和语义网框架的基础上完成了以下工作:一、总结知识库管理所面临的五类场景需求,根据知识库管理的实际需要提出了面向开放链接数据的知识库管理系统。二、本文将知识库管理系统分为解析层、模型层、存储层、查询层和应用层五个层次,设计了知识存储、知识抽取、多类型查询引擎、本体算法组件等功能模块。三、文章阐述了系统中多项关键技术的研究和实现过程。首先基于Jena设计了支持图存储结构的数据类型,对RDF数据模型和本体建模,在此基础上实现了结构化和非结构化链接数据的解析器/读写器。然后本文总结了自动化本体管理的核心问题,以概念和概念层次结构为基础,提出综合相似性度量用于本体搜索,并使用有监督学习分类器和WordNet词典系统实现了本体映射和合并算法。同时还基于依存分析完成语义查询的解析,设计了多类型查询引擎的查询语言转换流程。四、最后对知识库管理系统进行了一系列功能测试,验证了系统功能模块的可用性,并使用BSBM等测试数据集检验了系统性能。本文的研究成果是提出了一种知识库管理的新方案,明确了知识库管理的需求和功能设计,并实现了可用的知识库管理系统,为知识工程的发展和创新提供了新的思路。其创新点在于实现了知识库模式层和数据层的分离管理,使用自动化的本体搜索、映射、合并算法减少了本体管理的人力成本,并提供了多类型的知识查询方式。
二、RDF文档解析器及查询语言的实现(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、RDF文档解析器及查询语言的实现(论文提纲范文)
(1)检务公开人机交互场景下的语义理解(论文提纲范文)
摘要 |
ABSTRACT |
符号对照表 |
缩略语对照表 |
第一章 绪论 |
1.1 研究的背景与意义 |
1.2 国内外研究现状 |
1.3 论文的研究内容及方法 |
1.4 论文的组织结构 |
第二章 中文语义理解技术概述 |
2.1 中文分词技术 |
2.2 语义依存分析技术 |
2.2.1 语义依存体系 |
2.2.2 语义依存分析算法 |
2.3 SPARQL查询技术 |
2.3.1 资源描述框架RDF |
2.3.2 RDF查询语言SPARQL |
2.4 本章小结 |
第三章 基于BERT模型的中文分词方法的研究与设计 |
3.1 BERT模型分析 |
3.2 基于BERT模型中文分词方法的设计与改进 |
3.2.1 BERT模型中文分词方法的设计与实现 |
3.2.2 BERT模型中文分词方法的分析与改进 |
3.3 中文分词算法的测试 |
3.3.1 实验环境描述 |
3.3.2 测试数据集 |
3.3.3 测试结果与分析 |
3.4 本章小结 |
第四章 基于图的语义依存分析方法的研究与设计 |
4.1 BiLSTM和Eisner算法分析 |
4.1.1 BiLSTM算法 |
4.1.2 Eisner算法 |
4.2 基于图的语义依存算法的分析与改进 |
4.2.1 语义依存分析算法的设计与实现 |
4.2.2 语义依存分析算法的分析与改进 |
4.3 语义依存分析算法的测试 |
4.3.1 测试数据集 |
4.3.2 测试结果与分析 |
4.4 本章小结 |
第五章 SPARQL查询语句构建方法的研究与设计 |
5.1 SPARQL查询语句分析 |
5.2 SPARQL查询语句构建方法的设计与实现 |
5.2.1 查询三元组的抽取规则和算法实现 |
5.2.2 查询三元组构建SPARQL语句的方法实现 |
5.3 SPARQL查询语句构建方法的测试 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 研究总结 |
6.2 研究展望 |
参考文献 |
附录 |
附录A:标注集 |
致谢 |
作者简介 |
(2)课程及教学大纲的本体构建及其在语义搜索的应用(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 引言 |
1.2 国内外研究现状 |
1.2.1 课程及教学大纲本体的研究现状 |
1.2.2 语义网技术的应用现状 |
1.3 主要工作 |
1.4 论文组织结构 |
第2章 相关理论与技术介绍 |
2.1 语义网与知识图谱 |
2.2 本体理论与相关构建技术 |
2.2.1 本体概念 |
2.2.2 本体相关语言 |
2.2.3 领域本体构建方法 |
2.2.4 本体建模工具 |
2.3 依存句法分析 |
2.4 本章小结 |
第3章 课程与教学大纲本体构建 |
3.1 领域本体构建方法对比 |
3.2 ECS本体构建方法 |
3.2.1 骨架法与七步法 |
3.2.2 ECS方法流程 |
3.2.3 ECS方法详解 |
3.2.4 评价标准对比 |
3.3 确定本体的领域和范围 |
3.3.1 领域信息数据来源 |
3.3.2 课程与教学大纲的领域和范围 |
3.4 考察可复用本体 |
3.5 列举重要术语 |
3.6 定义类与类的层次结构 |
3.6.1 课程本体类层次结构 |
3.6.2 教学大纲本体类层次 |
3.6.3 综合本体层次图 |
3.7 定义类的属性和约束 |
3.7.1 类的属性 |
3.7.2 类的属性约束 |
3.8 类的实例化 |
3.8.1 课程本体实例 |
3.8.2 教学大纲本体实例 |
3.9 本体OWL表示 |
3.10 本章小结 |
第4章 课程与教学大纲本体的理论验证 |
4.1 一致性验证 |
4.1.1 推理机 |
4.1.2 SWRL规则 |
4.2 SPARQL验证 |
4.3 本体文档化 |
4.4 本章小结 |
第5章 课程与教学大纲本体的语义搜索 |
5.1 系统需求分析 |
5.2 系统设计 |
5.2.1 系统开发环境 |
5.2.2 系统框架设计 |
5.3 系统实现 |
5.3.1 系统执行流程 |
5.3.2 语义解析模块 |
5.3.3 本体查询模块 |
5.3.4 问题推荐模块 |
5.4 实验与分析 |
5.4.1 搜索测试 |
5.4.2 对比效果 |
5.5 系统运行结果 |
5.5.1 系统首页 |
5.5.2 搜索结果 |
5.6 本章小结 |
第6章 总结与展望 |
6.1 本文总结 |
6.2 工作展望 |
参考文献 |
致谢 |
(3)基于本体的MVC架构模式识别及重构技术(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景与意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.2.1 设计模式识别研究现状 |
1.2.2 架构模式识别研究现状 |
1.2.3 架构重构研究现状 |
1.2.4 国内外研究现状分析 |
1.3 论文主要工作 |
1.4 论文章节安排 |
第二章 背景知识 |
2.1 软件架构模式 |
2.1.1 软件架构模式基本概念 |
2.1.2 MVC架构模式 |
2.2 源码解析 |
2.2.1 抽象语法树 |
2.2.2 JDT简介 |
2.3 本体及推理 |
2.3.1 本体概念 |
2.3.2 描述逻辑 |
2.3.3 OWL语言 |
2.3.4 本体推理 |
2.4 本章小结 |
第三章 MVC架构模式识别 |
3.1 构建MVC概念层本体 |
3.2 构建特定目标系统本体 |
3.2.1 构建实体关系图 |
3.2.2 构建特定目标系统本体 |
3.3 推理本体 |
3.4 本章小结 |
第四章 基于MVC模式识别结果的重构 |
4.1 重构简介 |
4.2 重构需求 |
4.2.1 模型视图分离 |
4.2.2 控制器功能单一 |
4.3 重构方案 |
4.3.1 获取重构点 |
4.3.2 实施重构 |
4.3.3 重构验证 |
4.4 本章小结 |
第五章 原型工具设计与实现 |
5.1 原型工具简介 |
5.1.1 原型工具软硬件环境 |
5.1.2 相关开源技术 |
5.2 原型工具架构设计 |
5.2.1 总体架构设计 |
5.2.2 数据库架构设计 |
5.3 原型工具详细设计 |
5.3.1 数据库详细设计 |
5.3.2 MVC架构模式识别 |
5.3.2.1 构建MVC架构模式本体 |
5.3.2.2 构建特定目标系统本体 |
5.3.2.3 推理 |
5.3.3 MVC架构模式重构 |
5.3.4 原型工具可视化 |
5.3.4.1 项目及版本信息可视化 |
5.3.4.2 MVC架构模式识别可视化 |
5.3.4.3 MVC架构模式重构可视化 |
5.4 本章小结 |
第六章 实验与分析 |
6.1 MVC架构模式识别实验及分析 |
6.1.1 MVC架构模式实验及分析 |
6.1.2 模式组成元素实验及分析 |
6.2 MVC架构模式重构实验与分析 |
6.2.1 重构点实验与分析 |
6.2.2 重构建议有效性验证实验与分析 |
6.3 本章小结 |
第七章 总结与展望 |
7.1 本文工作总结 |
7.2 后续工作展望 |
致谢 |
参考文献 |
作者简介 |
(4)基于农业叙词表的知识图谱构建技术研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 研究目的与意义 |
1.2 国内外研究现状 |
1.2.1 知识图谱研究进展 |
1.2.2 基于叙词表的本体构建方法研究进展 |
1.2.3 命名实体识别方法研究进展 |
1.2.4 关系抽取方法研究进展 |
1.3 研究内容 |
1.4 研究方法与技术路线 |
1.5 论文组织结构 |
第2章 基于叙词表的农业知识图谱构建方法 |
2.1 引言 |
2.2 农业知识图谱的理论基础 |
2.2.1 农业科学叙词表 |
2.2.2 知识表示 |
2.2.3 知识存储和查询 |
2.3 基于叙词表的农业知识图谱构建 |
2.3.1 叙词表到农业知识图谱模式层的转换 |
2.3.2 叙词表到农业知识图谱数据层的构建 |
2.3.3 农业知识图谱三元组的描述 |
2.3.4 农业知识图谱语义 |
2.4 基于叙词表的农业知识图谱存储与查询 |
2.5 本章小结 |
第3章 基于集成学习的农业实体识别模型 |
3.1 引言 |
3.2 实体识别模型的理论基础 |
3.2.1 神经元模型 |
3.2.2 多层神经网络与反向传播 |
3.2.3 循环神经网络 |
3.2.4 长短期记忆序列模型 |
3.2.5 条件随机场 |
3.3 基于BILSTM-CRF模型的农业实体识别 |
3.3.1 BILSTM-CRF实体识别模型 |
3.3.2 构建农业实体识别数据集Agri NER2018 |
3.3.3 实验结果分析 |
3.4 一种改进的农业实体识别模型ELER |
3.4.1 集成学习 |
3.4.2 ELER模型 |
3.4.3 特征表示 |
3.4.4 目标函数 |
3.4.5 标签模式 |
3.4.6 网络模型设置 |
3.4.7 算法训练过程 |
3.5 实验设置 |
3.5.1 实验数据 |
3.5.2 数据预处理 |
3.5.3 实验环境 |
3.6 实验分析 |
3.6.1 评价指标 |
3.6.2 Agri NER2018数据集上的实验结果 |
3.6.3 Co NLL2003数据集上的实验结果 |
3.6.4 讨论 |
3.7 本章小结 |
第4章 基于BERT预训练的农业实体关系联合抽取模型 |
4.1 引言 |
4.2 联合抽取模型的理论基础 |
4.2.1 Encoder-Decoder模型 |
4.2.2 联合抽取模型LSTM-LSTM-Bias |
4.2.3 词的分布式表示 |
4.3 基于LSTM-LSTM-BIAS模型的农业实体关系抽取 |
4.3.1 构建农业实体关系抽取数据集Agri Relation2018 |
4.3.2 实验结果分析 |
4.4 一种改进的联合抽取模型BERT-BILSTM-LSTM |
4.4.1 BERT模型 |
4.4.2 联合抽取模型BERT-BILSTM-LSTM |
4.4.3 预训练 |
4.4.4 目标函数 |
4.4.5 标签模式 |
4.4.6 网络模型设置 |
4.4.7 算法训练过程 |
4.5 实验设置 |
4.5.1 实验数据 |
4.5.2 实验环境 |
4.6 实验分析 |
4.6.1 评价指标 |
4.6.2 Agri Relation2018数据集上的实验结果 |
4.6.3 NYT数据集上的实验结果 |
4.6.4 讨论 |
4.7 本章小结 |
第5章 农业知识图谱构建与应用系统设计与实现 |
5.1 系统逻辑架构 |
5.2 系统功能设计 |
5.3 基于叙词表的知识图谱实现 |
5.3.1 将叙词表的内容存储到My SQL数据库中 |
5.3.2 将数据库中的叙词转化为RDF文档 |
5.3.3 生成基于叙词表的农业知识图谱 |
5.3.4 数据结构设计 |
5.4 系统主要功能模块实现及可视化 |
5.4.1 农业科学叙词查询 |
5.4.2 实体类别标注 |
5.4.3 实体识别 |
5.4.4 关系抽取 |
5.4.5 查询实体 |
5.4.6 关系查询 |
5.4.7 农业知识问答 |
5.5 本章小结 |
第6章 结论与展望 |
6.1 主要结论 |
6.2 创新点 |
6.3 研究展望 |
参考文献 |
致谢 |
作者简介 |
(5)基于本体的事件驱动架构模式识别与重构方法研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 研究现状 |
1.2.2 研究现状分析 |
1.3 论文主要工作 |
1.3.1 研究内容 |
1.3.2 研究目标 |
1.4 论文组织结构 |
第二章 基于本体的事件驱动架构模式识别 |
2.1 引言 |
2.2 事件驱动架构模式识别 |
2.2.1 实例层本体构建 |
2.2.2 概念层本体构建 |
2.2.3 推理与查询 |
2.3 本章小结 |
第三章 事件驱动架构模式的重构 |
3.1 引言 |
3.2 基于事件驱动架构模式识别的重构 |
3.2.1 重构点定位 |
3.2.2 实施重构方案 |
3.3 本章小结 |
第四章 工具设计与实现 |
4.1 需求分析 |
4.1.1 工具概述 |
4.1.2 功能需求 |
4.2 概要设计 |
4.3 详细设计与实现 |
4.3.1 基于本体的架构模式识别模块 |
4.3.2 基于模式识别结果重构模块 |
4.4 本章小结 |
第五章 实验与分析 |
5.1 实验目的及实验环境 |
5.2 实验案例 |
5.3 实验内容 |
5.3.1 事件驱动架构模式识别准确性验证实验 |
5.3.2 事件驱动架构模式实例识别准确性验证实验 |
5.3.3 基于事件驱动架构模式识别的重构方法有效性验证实验 |
5.4 效度威胁 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 主要工作总结 |
6.2 未来工作展望 |
致谢 |
参考文献 |
作者简介 |
(6)基于分布式技术的配电网全网数据建模研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 研究内容 |
1.4 论文结构 |
1.5 本章小结 |
第2章 关键技术分析 |
2.1 IEC 61970标准 |
2.2 CIM介绍 |
2.3 XML和XML解析技术 |
2.3.1 XML定义和特点 |
2.3.2 XML解析技术 |
2.4 SVG技术 |
2.5 Hadoop生态系统 |
2.5.1 Hadoop技术 |
2.5.2 Zookeeper技术 |
2.5.3 HBase技术 |
2.6 本章小结 |
第3章 CIM/XML拓扑信息的导入 |
3.1 CIM/XML电网结构分析 |
3.1.1 子控制区信息(SubControlArea) |
3.1.2 厂站信息(Substation) |
3.1.3 变压器信息(PowerTransformer) |
3.1.4 母线信息(BusbarSection) |
3.1.5 电压等级信息(BaseVoltage) |
3.1.6 交流线段信息(ACLineSegment) |
3.1.7 断路器信息(Breaker) |
3.1.8 隔离开关信息(Disconnector) |
3.1.9 端子信息(Terminal) |
3.1.10 连接点信息(ConnectivityNode) |
3.2 基于CIM/XML的数据库设计 |
3.2.1 变电站模型 |
3.2.2 线路模型 |
3.2.3 断路器模型 |
3.2.4 隔离开关模型 |
3.3 CIM/XML拓扑分析 |
3.4 CIM/XML解析和入库 |
3.4.1 CIM/XML文件解析 |
3.4.2 HBase数据导入 |
3.5 本章小结 |
第4章 全网数据模型设计与实现 |
4.1 模型合并的基本要求 |
4.2 模型拆分模块 |
4.3 模型拼接模块 |
4.4 模型生成模块 |
4.5 系统体系结构 |
4.6 模型应用 |
4.6.1 基于SVG文件的电网地理信息提取 |
4.6.2 基于CIM/XML文件的电网电气拓扑信息提取 |
4.6.3 电网拓扑的等效简化及数据结构体构建 |
4.6.4 变电站模型合并实现 |
4.7 本章小结 |
第5章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
攻读硕士学位期间发表的论文及其他成果 |
致谢 |
(7)时态RDF(S)的自动化构建与存储方法研究(论文提纲范文)
摘要 |
ABSTRACT |
缩略词 |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 RDF(S)自动构建 |
1.2.2 RDF(S)存储 |
1.2.3 时态数据模型 |
1.3 主要研究内容 |
1.4 论文的组织结构 |
第二章 时态数据模型 |
2.1 RDF(S) |
2.2 时间维度与区间计算 |
2.3 时态RDF(S) |
2.3.1 时态模型 |
2.3.2 T-SPARQL时态查询语言 |
2.4 时态XML与XML Schema模型 |
2.4.1 时态XML Schema |
2.4.2 时态XML文档 |
2.5 本章小结 |
第三章 基于XML的时态RDF(S)自动构建方法 |
3.1 时态XML Schema向时态RDFS模型映射 |
3.1.1 映射规则 |
3.1.2 映射算法 |
3.2 时态XML文档向时态RDF数据模型映射 |
3.2.1 映射规则 |
3.2.2 映射算法 |
3.3 实例分析 |
3.4 时态RDF(S)自动构建原型系统 |
3.4.1 模块设计 |
3.4.2 系统实现 |
3.4.3 运行分析 |
3.5 本章小结 |
第四章 基于HBase的时态RDF(S)数据存储方法 |
4.1 HBase内置时间模型 |
4.1.1 HBase数据模型与系统结构 |
4.1.2 时间表达问题 |
4.2 时态RDF(S)的存储模型 |
4.2.1 TClass |
4.2.2 TProperty |
4.2.3 SP_OT、OS_PT、PO_ST |
4.3 查询方法 |
4.4 实验及结果分析 |
4.4.1 数据准备 |
4.4.2 查询测试 |
4.5 本章小结 |
第五章 总结与展望 |
5.1 研究工作总结 |
5.2 工作展望 |
参考文献 |
致谢 |
在学期间的研究成果及发布的学术论文 |
(8)面向语义描述与数据查询的大数据组织方法及其关键应用技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景与目的 |
1.2 相关问题的国内外研究现状 |
1.2.1 异构数据集成技术与系统研究现状 |
1.2.2 面向异构数据集成的统一建模研究现状 |
1.2.3 基于公共数据模型的逻辑推理与知识发现的相关理论及研究现状 |
1.2.4 以NoSQL为主的大数据模型 |
1.3 论文的主要研究内容与创新点 |
1.4 论文的组织结构及各章主要内容 |
第二章 GDM公共数据模型 |
2.1 异构数据集成问题描述 |
2.2 主要公共数据模型介绍 |
2.2.1 面向结构的数据模型 |
2.2.2 面向语义的数据模型 |
2.3 基于关系和概念的格数据模型(GDM) |
2.3.1 格数据关系 |
2.3.2 格数据类型 |
2.3.3 模型的形式化定义 |
2.4 本章小结 |
第三章 GDM模型的数据语义描述和推理 |
3.1 问题描述 |
3.2 GDM模型的语义表达和演化 |
3.3 GDM模型与描述逻辑及知识表示 |
3.3.1 概念映射 |
3.3.2 GDM节与公理映射 |
3.3.3 GDM关系与角色映射 |
3.3.4 GDM个体与事实映射 |
3.4 转化正确性及相关推理问题证明 |
3.5 本章小结 |
第四章 面向大数据集成的异构数据源模式转换 |
4.1 模式映射简介 |
4.1.1 模式映射方法 |
4.1.2 模式映射过程 |
4.2 关系数据模型的模式转换 |
4.3 以XML为代表的半结构化数据模型的模式转换 |
4.4 NOSQL数据模型的模式转换 |
4.5 混合模式及动态数据集成 |
4.6 本章小结 |
第五章 GDM模型数据管理 |
5.1 GDM数据管理的图论基础 |
5.2 GDM模型代数运算 |
5.2.1 模式代数 |
5.2.2 GDM对象代数 |
5.3 GDM数据查询与操作 |
5.3.1 格数据操作模型 |
5.3.2 基于SQL的GDM数据查询与操作 |
5.3.3 GDM数据查询过程与优化 |
5.4 本章小结 |
第六章 基于GDM的异构数据集成的查询、处理与优化 |
6.1 基于中间模式的多层局部自治集成模型 |
6.1.1 集成模型的定义 |
6.1.2 模式的类型与映射 |
6.2 异构数据集成的查询处理机制与过程 |
6.2.1 全局查询语言及查询变量关联 |
6.2.2 查询分解与查询计划生成 |
6.2.3 查询结果处理及并行调度 |
6.3 分布式异构环境下基于并行调度的查询优化 |
6.3.1 异构数据集成中的查询处理代价模型 |
6.3.2 预定义查询优化 |
6.3.3 自适应查询优化 |
6.3.4 综合优化策略 |
6.3.5 查询优化策略的评价与分析 |
6.4 本章小结 |
第七章 GDM模型特性分析与集成效率评价 |
7.1 数据模型综合分类与定性比较分析 |
7.1.1 数据模型分类 |
7.1.2 基本特性的定性分析与比较 |
7.2 与OWL的对比与分析 |
7.3 数据集成时间与空间效率的评价分析 |
7.3.1 数据集成的时间与空间效率评估模型 |
7.3.2 初始化参数的一些假设和解释 |
7.3.3 实验结果的比较与分析 |
7.4 本章小结 |
第八章 异构数据集成系统的设计与实现 |
8.1 基于GDM的异构数据集成系统的语义操作层次框架 |
8.2 一种综合的多策略相似度衡量方法 |
8.3 基于GDM模型的异构数据集成系统 |
8.3.1 开发环境与相关配置 |
8.3.2 系统架构及实施体系 |
8.3.3 格数据引擎核心功能展示与说明 |
8.3.4 Paragraph Turbo核心功能展示与说明 |
8.4 本章小结 |
总结与展望 |
参考文献 |
附录A:GDM模型中数据以及关系的层次 |
附录B:GDM模型结点类型 |
附录C:GDM SQL语法定义 |
攻读博士学位期间取得的研究成果 |
致谢 |
附件 |
(9)基于CDQ的油田开发数据质量研究(论文提纲范文)
摘要 |
ABSTRACT |
创新点摘要 |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 数据质量框架及评估模型的研究现状 |
1.2.2 本体在数据质量管理领域应用的研究现状 |
1.2.3 存在的问题 |
1.2.4 本体在数据质量管理中的作用 |
1.3 论文研究内容与组织结构 |
1.3.1 论文研究内容 |
1.3.2 论文组织结构 |
1.4 本章小结 |
第二章 数据质量相关理论及技术研究 |
2.1 数据质量概念及维度 |
2.1.1 数据质量概念 |
2.1.2 数据质量维度 |
2.2 本体基础理论及推理研究 |
2.2.1 本体定义 |
2.2.2 本体描述语言 |
2.2.3 本体组成元素 |
2.2.4 本体建模工具 |
2.2.5 本体推理 |
2.3 关联数据理论研究 |
2.4 本章小结 |
第三章 数据质量管理元本体构建 |
3.1 数据质量框架 |
3.2 数据质量管理元本体构建 |
3.2.1 数据质量管理元本体构建流程 |
3.2.2 数据质量管理元本体的构建原则 |
3.3 基于CDQ框架的数据质量管理元本体构建 |
3.3.1 定义阶段 |
3.3.2 评估阶段 |
3.3.3 改善阶段 |
3.3.4 数据质量约束规则的具体描述 |
3.3.5 数据清洗规则的具体描述 |
3.4 数据质量管理元本体表示 |
3.4.1 数据质量管理元本体展示 |
3.4.2 数据质量管理元本体语言描述 |
3.5 本章小结 |
第四章 基于数据质量管理元本体的规则构建 |
4.1 推理在数据质量管理中的作用 |
4.2 本体推理工具及工作原理 |
4.2.1 Jess推理引擎 |
4.2.2 SWRL规则语言 |
4.2.3 SWRLTab+Jess |
4.3 数据质量管理推理总体流程 |
4.4 建立油田领域数据质量管理实例 |
4.4.1 实例化数据元素 |
4.4.2 实例化规则 |
4.5 SWRL规则构建 |
4.5.1 数据元素制定约束规则推理 |
4.5.2 数据元素推理 |
4.5.3 约束规则选取任务推理 |
4.5.4 数据元素评估得分推理 |
4.5.5 推荐改善数据元素推理 |
4.5.6 清洗规则选取任务推理 |
4.6 本章小结 |
第五章 数据质量管理系统设计与实现 |
5.1 数据质量管理系统实现理论 |
5.1.1 本体解析器Jena |
5.1.2 SPARQL查询语言 |
5.2 数据质量管理系统总体设计 |
5.2.1 数据质量管理系统总体设计框架 |
5.2.2 数据质量管理系统功能模块图 |
5.2.3 数据质量管理系统角色及功能设计 |
5.2.4 数据质量管理系统功能模块详细流程设计 |
5.3 数据质量管理系统模块设计 |
5.4 数据质量管理系统实现 |
5.4.1 基本信息管理模块 |
5.4.2 数据质量管理元本体解析模块 |
5.4.3 元本体管理模块 |
5.4.4 数据元素管理模块 |
5.4.5 规则管理模块 |
5.4.6 数据质量评估模块 |
5.4.7 数据清洗模块 |
5.5 本章小结 |
结论 |
参考文献 |
发表文章目录 |
致谢 |
(10)面向开放链接数据的知识库管理系统设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 选题背景 |
1.2 国内外研究现状 |
1.2.1 语义网及本体工程 |
1.2.2 开放链接数据与知识库的应用 |
1.3 本文的研究目的和研究内容 |
1.4 本文的组织结构 |
第二章 相关技术分析 |
2.1 语义网标准 |
2.1.1 RDF数据模型 |
2.1.2 SPARQL查询语言 |
2.2 开放链接数据 |
2.3 本体工程 |
2.3.1 本体的定义 |
2.3.2 OWL和OMV标准 |
2.3.3 本体工程的一般问题 |
2.4 知识库存储和管理 |
2.4.1 知识存储 |
2.4.2 语义网开源框架 |
2.5 本章小结 |
第三章 面向开放链接数据的知识库管理系统概要设计 |
3.1 问题提出与定义 |
3.2 需求分析 |
3.3 功能结构 |
3.4 系统框架模型 |
3.4.1 数据类型 |
3.4.2 解析器/读写器 |
3.4.3 存储和查询 |
3.4.4 本体算法组件 |
3.4.5 RESTful应用服务 |
3.5 本章小结 |
第四章 面向开放链接数据的知识库管理系统关键技术 |
4.1 基于图数据库的知识存储 |
4.1.1 Neo4J的图数据模型 |
4.1.2 RDF模型到图数据库的映射 |
4.2 面向开放链接数据的知识抽取 |
4.2.1 结构化知识抽取 |
4.2.2 非结构化知识抽取 |
4.3 本体工程的自动化算法 |
4.3.1 基于概念的本体综合相似度计算 |
4.3.2 基于有监督学习的本体映射算法 |
4.3.3 基于WordNet的本体合并算法 |
4.4 知识库的查询方式 |
4.4.1 SPARQL查询的转换 |
4.4.2 语义查询的转换 |
4.5 本章小结 |
第五章 知识库管理系统功能模块的详细设计与实现 |
5.1 知识存储模块的实现 |
5.1.1 数据层存储功能 |
5.1.2 模式层存储功能 |
5.2 解析器/读写器模块的实现 |
5.2.1 Parser功能 |
5.2.2 Writer功能 |
5.3 本体算法组件模块的实现 |
5.3.1 相似本体搜索功能 |
5.3.2 本体映射功能 |
5.3.3 本体合并功能 |
5.4 多类型查询引擎模块的实现 |
5.5 本章小结 |
第六章 系统部署和测试 |
6.1 系统部署环境 |
6.2 系统测试与结果分析 |
6.2.1 系统功能测试 |
6.2.2 系统性能测试 |
6.3 本章小结 |
第七章 总结与展望 |
7.1 论文总结 |
7.2 展望 |
参考文献 |
致谢 |
四、RDF文档解析器及查询语言的实现(论文参考文献)
- [1]检务公开人机交互场景下的语义理解[D]. 于鸿飞. 西安电子科技大学, 2020(05)
- [2]课程及教学大纲的本体构建及其在语义搜索的应用[D]. 彭潇. 浙江工商大学, 2019(05)
- [3]基于本体的MVC架构模式识别及重构技术[D]. 尹强. 东南大学, 2019(06)
- [4]基于农业叙词表的知识图谱构建技术研究[D]. 乔波. 湖南农业大学, 2019
- [5]基于本体的事件驱动架构模式识别与重构方法研究[D]. 汪小飞. 东南大学, 2019(06)
- [6]基于分布式技术的配电网全网数据建模研究[D]. 王宁. 华北电力大学(北京), 2019(01)
- [7]时态RDF(S)的自动化构建与存储方法研究[D]. 杨丹. 南京航空航天大学, 2019(02)
- [8]面向语义描述与数据查询的大数据组织方法及其关键应用技术研究[D]. 王新阳. 华南理工大学, 2018(02)
- [9]基于CDQ的油田开发数据质量研究[D]. 谢兰. 东北石油大学, 2018(07)
- [10]面向开放链接数据的知识库管理系统设计与实现[D]. 赵重威. 北京邮电大学, 2018(11)