关系型数据库设计模式

最近转战学英语语法界，大半时间花在死磕语法书上，疏于打理blog，惭愧。

所幸遇到一本好书： SQL Antipatterns （中文版叫《SQL反模式》）。

我之前对 RDBMS 存在一些非理性的、似是而非的认知，该书以皆反面教材的方式进行了厘清，同时，它对 RDBMS的设计决策亦给出了清晰的路径。

印象比较深刻的有这么两个章节：

一、树

在数据库设计中，树型关系的存储表示一直是一个难题——设计一个有效的树型关系没什么难的，考验人的是如何让这种数据结构在运行时更为直观、高效。

常规的树结构是怎么设计的，大概会有一个表示父结点引用的列，看起来像这样：

CREATE TABLE Nodes(
  node_id INT PRIMARY KEY,
  node_name VARCHAR(50),
  parent_id INT,
  FOREIGN KEY (parent_id) REFERENCES Nodes(node_id)
);

CREATE TABLE Nodes(

node_id INT PRIMARY KEY,

node_name VARCHAR(50),

parent_id INT,

FOREIGN KEY (parent_id) REFERENCES Nodes(node_id)

);

诚然，这种设计是能run起来的。只是，做为一种反模式 (Adjacency List)，它存在如下问题：

书中给出一些设计建议，颇有启发性：

Closure Table，一种更为彻底的全路径结构，分别记录路径上相关结点的全展开形式。能明晰任意两结点关系而无须多余查询，级联删除和结点移动也很方便。但是它的存储开销会大一些，除了表示结点的Meta信息，还需要一张专用的关系表：

ancestor	descendant	ancestor	descendant	ancestor	descendant
1	1	1	7	4	6
1	2	2	2	4	7
1	3	2	3	5	5
1	4	3	3	6	6
1	5	4	4	6	7
1	6	4	5	7	7

二、图片文件的存储

我的上一份工作是在一家互联网公司服务，刚好他们用户的 avatar 资料就存储在表中（SQL SERVER 的 VarBinary），所以对于这种将二进制数据存储在BLOB字段中的搞法，倒也并不吃惊，只是书中对于为什么不用文件形式存储给出的理由，颇让我信服，也是我之前没有深入思考过的：

其他章节如全文检索、Hash加盐、Active Record 也都刷新我的认知，呵呵，以后也能好意思跟人喷，我懂数据库了 ^ ^

打赏作者

您的支持将激励我继续创作！

去打赏

Mo Ye