2023年数据库实验心得.docx

上传人:wj151****6093 文档编号:66521983 上传时间:2022-12-14 格式:DOCX 页数:8 大小:14.39KB
返回 下载 相关 举报
2023年数据库实验心得.docx_第1页
第1页 / 共8页
2023年数据库实验心得.docx_第2页
第2页 / 共8页
点击查看更多>>
资源描述

《2023年数据库实验心得.docx》由会员分享,可在线阅读,更多相关《2023年数据库实验心得.docx(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、2023年数据库实验心得 我在sql server 索引基础知识系列中,第一篇就讲了记录数据的基本格式。那里主要讲解的是,数据库的最小读存单元:数据页。一个数据页是8k大小。 对于数据库来说,它不会每次有一个数据页变化后,就存到硬盘。而是变化达到一定数量级后才会作这个操作。 这时候,数据库并不是以数据页来作为操作单元,而是以64k的数据(8个数据页,一个区)作为操作单元。 区是管理空间的基本单位。一个区是八个物理上连续的页(即 64 kb)。这意味着 sql server 数据库中每 mb 有 16 个区。 为了使空间分配更有效,sql server 不会将所有区分配给包含少量数据的表。sql

2、 server 有两种类型的区: 统一区,由单个对象所有。区中的所有 8 页只能由所属对象使用。 混合区,最多可由八个对象共享。区中八页的每页可由不同的对象所有。 通常从混合区向新表或索引分配页。当表或索引增长到 8 页时,将变成使用统一区进行后续分配。如果对现有表创建索引,并且该表包含的行足以在索引中生成 8 页,则对该索引的所有分配都使用统一区进行。 为何会这样呢? 其实很简单: 读或写 8kb 的时间与读或写 64 kb的时间几乎相同。 在 8 kb 到 64 kb 范围之内,单个磁盘 i/o 传输操作所花的时间主要是磁盘取数臂和读/写磁头运动的时间。 因此,从数学上来讲,当需要传输 6

3、4 kb 以上的 sql 数据时, 尽可能地执行 64 kb 磁盘传输是有益的,即分成数个64k的操作。 因为 64 kb 传输基本上与 8 kb 传输一样快,而每次传输的 sql server 数据是 8 kb 传输的 8 倍。 我们通过一个实例来看 有and 操作符时候的最常见的一种情况。我们有下面一个表, create table dbo.member( member_no dbo.numeric_id identity(1,1) not null, lastname dbo.shortstring not null, firstname dbo.shortstring not null

4、, middleinitial dbo.letter null, street dbo.shortstring not null, city dbo.shortstring not null, state_prov dbo.statecode not null, country dbo.countrycode not null, mail_code dbo.mailcode not null, phone_no dbo.phonenumber null, photograph image null, iue_dt datetime not null default (getdate(), ex

5、pr_dt datetime not null default (dateadd(year,1,getdate(), region_no dbo.numeric_id not null, corp_no dbo.numeric_id null, prev_balance money null default (0), curr_balance money null default (0), member_code dbo.status_code not null default ( ) 这个表具备下面的四个索引: 索引名 细节 索引的列 member_corporation_link nonc

6、lustered located on primary corp_no member_ident clustered, unique, primary key located on primary member_no member_region_link nonclustered located on primary region_no memberfirstname nonclustered located on primary firstname 当我们执行下面的sql查询时候, select m.member_no, m.firstname, m.region_nofrom dbo.me

7、mber as mwhere m.firstname like k% and m.region_no 6 and m.member_no sql server 会根据索引方式,优化成下面方式来执行。 select a.member_no,a.firstname,b.region_nofrom(select m.member_no, m.firstname from dbo.member as m where m.firstname like k% and m.member_no (select m.member_no, m.region_no from dbo.member as mwhere

8、 m.region_no 6) b - 这个查询可以直接使用 member_region_link 非聚集索引,而且这个非聚集索引覆盖了所有查询列- 实际执行时,只需要 逻辑读取 10 次 where a.member_no = b.member_no 不信,你可以看这两个sql 的执行计划,以及逻辑读信息,都是一样的。 其实上面的sql,如果优化成下面的方式,实际的逻辑读消耗也是一样的。为何sql server 不会优化成下面的方式。是因为 and 操作符优化的另外一个原则。 1/26 的数据和 1/6 的数据找交集的速度要比 1/52 的数据和 1/3 的数据找交集速度要慢。 select

9、 a.member_no,a.firstname,b.region_nofrom(select m.member_no, m.firstname from dbo.member as mwhere m.firstname like k% - 1/26 数据) a, (select m.member_no, m.region_no from dbo.member as mwhere m.region_no 6 and m.member_no 当然,我们要学习sql 如何优化的话,就会用到查询语句中的一个功能,指定查询使用哪个索引来进行。 比如下面的查询语句 select m.member_no,

10、 m.firstname, m.region_nofrom dbo.member as m with (index (0)where m.firstname like k% and m.region_no 6 and m.member_no select m.member_no, m.firstname, m.region_nofrom dbo.member as m with (index (1)where m.firstname like k% and m.region_no 6 and m.member_no 6 and m.member_no 6 and m.member_no 这里

11、index 计算符可以是 0 ,1, 指定的一个或者多个索引名字。对于 0 ,1 的意义如下: 如果存在聚集索引,则 index(0) 强制执行聚集索引扫描,index(1) 强制执行聚集索引扫描或查找(使用性能最高的一种)。 如果不存在聚集索引,则 index(0) 强制执行表扫描,index(1) 被解释为错误。 总结知识点: 简单来说,我们可以这么理解:sql server 对于每一条查询语句。会根据实际索引情况(sysindexes 系统表中存储这些信息),分析每种组合可能的成本。然后选择它认为成本最小的一种。作为它实际执行的计划。 成本代价计算的一个主要组成部分是逻辑i/o的数量,特

12、别是对于单表的查询。 and 操作要满足所有条件,这样,经常会要求对几个数据集作交集。数据集越小,数据集的交集计算越节省成本。 的项目中,竟然出现了滥用聚集索引的问题。看来没有培训最最基础的索引的意义,代价,使用场景,是一个非常大的失误。这篇博客就是从这个角度来罗列索引的基础知识。 使用索引的意义 索引在数据库中的作用类似于目录在书籍中的作用,用来提高查找信息的速度。 使用索引查找数据,无需对整表进行扫描,可以快速找到所需数据。 使用索引的代价 索引需要占用数据表以外的物理存储空间。 创建索引和维护索引要花费一定的时间。 当对表进行更新操作时,索引需要被重建,这样降低了数据的维护速度。 创建索

13、引的列 主键 外键或在表联接操作中经常用到的列 在经常查询的字段上最好建立索引 不创建索引的列 很少在查询中被引用 包含较少的惟一值 定义为 text、ntext 或者 image 数据类型的列 heaps是staging data的很好选择,当它没有任何index时 excellent for high performance data loading (parallel bulk load and parallel index creation after load) excellent as a partition to a partitioned view or a partition

14、ed table 聚集索引提高性能的方法,在前面几篇博客中分别提到过,下面只是一个简单的大纲,细节请参看前面几篇博客。 何时创建聚集索引? clustered index会提高大多数table的性能,尤其是当它满足以下条件时: 独特, 狭窄, 静止: 最重要的条件 持续增长的,最好是只向上增加。例如: identity date, identity guid (only when using newsequentialid() function) 聚集索引唯一性(独特型的问题) 由于聚集索引的b+树结构的叶子节点必须指向具体数据。如果你要建立聚集索引的列不唯一,并且你指定的创建的聚集索引是非唯一的聚集索引,则会有以下情况: 如果未使用 unique 属性创建聚集索引,数据库引擎 将向表自动添加一个四字节 uniqueifier 列。必要时,数据库引擎 将向行自动添加一个 uniqueifier 值,使每个键唯一。此列和列值供内部使用,用户不能查看或访问。 数据库实验心得 数据库实验心得 数据库实验 数据库实验 数据库实验心得与收货 数据库实验答案 数据库实验总结 Acce数据库实验 数据库上机实验 数据库实验一

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作报告

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁