Oracle 数据库整理表碎片

March 14, 2012

表碎片的来源

当针对一个表的删除操作很多时，表会产生大量碎片。删除操作释放的空间不会被插入操作立即重用，甚至永远也不会被重用。

怎样确定是否有表碎片

-- 收集表统计信息
SQL> exec dbms_stats.gather_table_stats(ownname=>'SCHEMA_NAME',tabname=> 'TABLE_NAME');

-- 确定碎片程度
SQL> SELECT table_name, ROUND ((blocks * 8), 2) "高水位空间 k",
   ROUND ((num_rows * avg_row_len / 1024), 2) "真实使用空间 k",
   ROUND ((blocks * 10 / 100) * 8, 2) "预留空间(pctfree) k",
   ROUND ((  blocks * 8
           - (num_rows * avg_row_len / 1024)
           - blocks * 8 * 10 / 100
          ),
          2
         ) "浪费空间 k"
  FROM dba_tables
  WHERE table_name = 'TABLE_NAME';

或者使用如下gist中的脚本找出某个 Schema 中表碎片超过25%的表。使用此脚本前，先确定 Schema 中表统计信息收集完整。

-- 查看表上次收集统计信息时间
select table_name,last_analyzed from dba_tables where owner = 'SCHEMA_NAME'

-- 收集整个 Schema 中对象的统计信息
SQL> exec dbms_stats.gather_schema_stats(ownname=>'SCHEMA_NAME');

为什么要整理表碎片

Oracle 对数据段的管理有一个高水位(HWM, High Water Mark)的概念。高水位是数据段中使用过和未使用过的数据块的分界线。高水位以下的数据块是曾使用过的，以上的是从未被使用或初始化过的。

当 Oracle 进行全表扫描(FTS, Full table scan)的操作时，它会读高水位下的所有数据块。如果高水位下还有很多空闲空间（碎片），读取这些空闲数据块会降低操作的性能。

行链接和行迁移

行链接 Row Chaining：当插入数据量大的行的，如果一个Block不能存放一条记录，该记录的一部分会存储到同个Extent中的其他Block，这些block形成一个数据块链。
行迁移 Row Migration：当Update的时候导致记录长度增加了，存储的Block已经满了，就会发生行迁移。Oracle会迁移整行数据到一个能够存储下整行数据的Block中，迁移的原始指针指向新的存放行数据的Block，ROWID不变。

当数据行发生链接（chain）或迁移（migrate）时，对其访问将会造成 I/O 性能降低，因为Oracle为获取这些数据行的数据，必须访问更多的数据块（data block）。

表碎片导致的问题

查询响应时间(尤其是全表扫描)变慢
产生大量行迁移
浪费空间

整理表碎片对基于索引的查询不会有太大性能提升。

如何整理表碎片

10g之前

两种方法：

导出表，删除表，再导入表
alter table move

一般选择第二种，需要重建索引。

10g后

从 10g 开始，提供一个 shrink 命令，需要表空间是基于自动段管理的。

可以分成两步操作：

-- 整理表，不影响DML操作
SQL> alter table TABLE_NAME shrink space compact;

-- 重置高水位，此时不能有DML操作
SQL> alter table TABLE_NAME shrink space;

也可以一步到位：

-- 整理表，并重置高水位
SQL> alter table TABLE_NAME shrink space;

shrink 的优势：

不需要重建索引。
可以在线操作。
不需要空闲空间，alter move需要跟当前表一样大小的空闲空间。

←

JavaScript 基本概念

最近读过和要读的书

→