基于数据字典的数据库索引技术研究
发布时间:2024-04-25 14:56:02 来源:文档文库
小
中
大
字号:
第48卷第3期 2015年3月 通信技术 Communications Technology Vo1.48 No.3 Mat.2015 doi:10.3969/j.issn.1002-0802.2015.03.011 基于数据字典的数据库索引技术研究 宋晨阳,寇 鹏,滕晓晓 (上海通用识别技术研究所,上海201112) 摘要:数据字典是指对数据的数据项、数据结构、数据流、数据存储、处理过程等进行定义和描述。 数据字典是数据库的中心,对每个用户非常重要,是信息系统进行数据分析阶段的主要工具。结合 数据字典设计原理,提出多种类型的数据字典规则,结合不同数据处理的需求,合理组合不同类型的 数据字典可以在很大程度上提升信息处理过程中的检索效率,通过对索引策略和多数据字典对应关 系的限制,增强数据库系统的健壮性,提高信息安全的强度。 关键词:数据字典信息索引 数据处理信息安全 文章编号:1002-0802(2015)03-0302-04 中图分类号:TP311.13 文献标志码:A Database Index Technology based on Data Dictionary SONG Chen—yang,KOU Peng,TENG Xiao—xiao (Shanghai General Recognition Technology Institute,Shanghai 201 1 12,China) Abstract:Data dictionary defines and describes data item,data structure,data flow,data storage and pro- cessing.As the center of database,data dictionary is of great importance to each user,and also selves as the main tool of information systems for data analysis.In combination with the design principle of data dic— tionary,the polytype data dictionary rules with different data processing requirements are proposed,and the rational combination of polytype data dictionary can greatly improve the retrieval eficiency ifn informa— tion processing.By resticting the retrrieval strategy and correspondance of muhidata dictionary,the robust— ness of database system could be enhanced and the intensity of information security also be improved. Key words:data dictionary;information index;data processing;information security 0 引 言 如今,针对海量数据的检索查询主要依赖于数 据库技术,通过数据库索引可以极大提高数据查询 1基础概念介绍 1.1数据字典 数据字典是数据库中存储级的,也是访问数据 库的接口…。数据字典是构建数据库过程中不可 缺少的组成部分,能够对数据库进行有效管理,对优 化数据库结构有重要作用。数据字典能够在数据库 设计阶段、实现阶段、运行阶段起着重要作用,能够 检索的速度。利用构造唯一性索引能够保证数据表 中特定数据的检索唯一性,显著减少查询中分组和 排序的时间。然而创建索引以及对所索引的维护往 往耗费大量的存储空间和时问。为了降低因数据量 的急剧增加引起的检索效率的下降,本文提出基于 多种数据字典建立检索策略的方法,从而可以提高 在不同阶段管理各种数据库信息。数据字典是各类 数据描述的集合,能进行详细的数据收集和数据分 析。通常包含5个部分:数据项、数据结构、数据流、 检索效率,减少不必要的系统开销,从而对数据库检 索提供了一种思路。 数据存储以及处理过程。 收稿日期:2014—09—28;修回日期:2015一Ol一30 Received date:2014—09—28;Revised date:>>>>2015一O1—30
第48卷 宋晨阳,寇鹏,滕晓晓:基于数据字典的数据库索引技术研究 第3期 数据项:数据项是数据的最小组成单位,若干个 数据项可以组成一个数据结构。数据项的描述 如下: 数据项m-.{数据项名称,数据项说明,数据类型, 数据项长度,数据项取值范围,数据项取值含义,数 据项之间的逻辑关系} ],其中“数据项取值范围”、 “数据项之间的逻辑关系”是限制数据项的约束条 件,是检验数据功能的依据。 数据结构:数据结构主要表现了数据之间的逻 辑关系。数据结构既能够由几个数据项构成,也能 够由几个数据结构构成,也可以由数据项和数据结 构共同构成。数据结构的描述如下: 数据结构={数据结构名称,数据结构说明,数 据结构组成}。 数据流:数据流描述了数据结构在数据库系统 内传输的轨迹。数据流的描述如下: 数据流描述={数据流名称,数据流说明,数据 流源,数据流去向,数据流组成,数据流平均流量,数 据流峰值流量}。 数据存储:数据存储描述了数据结构保存的位 置。数据存储的描述如下: 数据存储描述={数据存储名称,数据存储说 明,数据存储编号,数据存储组成,数据存储方式}。 处理过程:处理过程描述了数据字典中对数据 进行处理的过程性说明,处理过程的描述如下: 处理过程描述={处理过程名称,处理过程说 明,处理过程输入,处理过程输出,处理过程说明}。 1.2数据库索引 索引建立了数据表中某一列或者多列数据项值 排序的结构,通过索引能够对数据库中的信息进行 快速查询 j。索引是对数据库表中一个或多个列 的值进行排序的结构。如果想按特定职员的姓来查 找他或她,则与在表中搜索所有的行相比,索引有助 于更快地获取信息。数据库的索引类似于书籍的 索引。 索引可以加快数据库的检索速度。索引降低了 数据库插入、修改、删除等维护任务的速度,索引创 建在表上,不能创建在视图上。索引既可以直接创 建,也可以间接创建。利用索引进行检索,能够使查 询的过程更加高效快速,提高数据库系统的性能。 2多数据字典设计 全文检索不单是一种快速的字串匹配系统,要 获得良好的检索效果,必须灵活使用和参考数据字 典。数据字典的灵活运用可以提高检索效率与准确 性。本文提出建立如下类型的数据字典,通过在不 同检索条件组合可以有效满足信息检索条件。 2.1分词字典 中文按词索引和检索依赖于以字典为基础的分 词算法。分词字典由词汇组成,分词字典的每个词 汇具有语法属性,以提高分词的准确性。生僻词没 有加到分词字典的必要,通过其他检索方式也能 检索。