関係モデル

Next: 非正規関係モデル Up: 関係モデルと非正規関係モデル Previous: 関係モデルと非正規関係モデル

関係モデル

1970年にE.F.Coddが提唱した関係モデルは、データベースを関係の集合として表現したものである。関係とは、定義域(値の集合) の直積の部分集合として定義される。領域には属性という名前がつけられる。属性名は一意的でなければならないが、領域としては重複していてもかまわない。また領域は無限集合であってもよいが、データベースで使う関係はつねに有限集合だけである。たとえば表1

表 1: 関係の例

が関係の例である。名前、所属、所在地が属性であり、個々の値は属性の実現値である。実現値の組合せである行がタプルと呼ばれる。関係はタプルの集まりとみることができる。データ構造の面からみれば、スキーマは属性の集合で関係を定義することができる。この関係をで表わしたりする。このように関係はひじょうに単純な表現であるので、データベース理論での数学的な扱いが容易にできるようになった。関係はこのような表形式で表現されるがすべての表が関係というわけではない。関係であるためには次の2つの条件が成立しなければならない。

タプルは1つの関係の中では一意的でなければならない。
タプルを一意的に決定する(関係の中の)属性の集まりをキーといい、その中でのタプルの識別に使用するものを主キーというが、主キーは空値であってはならない。

それでは実世界を関係としてどのように表現するのだろうか。まず表現したい世界の属性を集め、表1のような関係を作る。この平坦な表表現、これが関係モデルのデータ構造である。しかしこのままだと、所属-所在地にデータの重複があったり、名前-所属の変更によって所属-所在地の情報が喪失する危険性がある。そこで属性間の意味制約、すなわち従属性(dependency)を考え、最初の表(第1正規形)に対し正規化(Normalization)をおこなう。

まず関数従属(functional dependency) が定義できる。これは関係の中の属性の集まりの値によって他の属性の集まりの値が一意的に決まるとき、はに関数従属であるといい、と書く。すなわち、もしタプルrの属性の値をと書けば、関数従属は任意のタプル、に対して

であることである。表1では、名前所属、所属所在地の2つの関数従属がある。このままだと、もし横田が所属を変更した場合そのタプルの所属と所在地を更新しなければならない。すると O が港区にあるという情報は失われてしまう。そこで関係を関数従属性にしたがって表2のように分割する。もっと一般化すると、キーに対する関数従属がその関係内でのすべての関数従属であるような関係に分割することである。このような関係を第3正規形と呼ぶ。この関数従属に基づく分割には第2正規型を始めいくつかのものがあるが、これらは関数従属をどのレベルでとらえるかの違いである。この第3正規形は上で述べたような情報の喪失を防ぐだけでなく、表2

表 2: 関数従属による分割

のように、重複した所属と所在地の組が除去され表現が簡潔になっている、すなわちデータの冗長性が減っている。したがってＯの所在地が変更になったとしても更新するのは1カ所だけであり、第１正規形よりも優れていることがわかる。

関係の正規化は関数従属だけによるものではない。多値従属性(multivalued dependency) も重要である。表3

表 3: 多値従属の関係

を考えよう。この関係は名前、趣味、同好会の3つからからなっている。この関係の中には関数従属性はないが、この関係を表4

表 4: 多値従属による分割

のように分割すると冗長性を減らすことができる。趣味とか同好会のように名前に対して複数の値をもつ場合を多値従属性と呼び、名前趣味(および名前同好会)と表わす。これは、もとの関係を名前と趣味、名前と同好会の2つの関係に分割してもよいことを意味している。複数に分割した関係を再び結合しても情報の喪失が生じないのは明らかだろう。

関数従属や多値従属の他にも多くの従属性が考えられている。ここでもっとも重要なことは、分割した関係を再びもとに戻しても情報の喪失がない、ということである。このような分割可能な最大の属性集合どおしの関係を結合従属性と呼んでいる。

次に関係に対するデータ操作を考えてみよう。関係モデルでは、集合操作を中心とする関係代数(Relational Algebra)と、一階述語論理の記述を使用した関係論理(Relational Calculus)がある。

まず関係代数であるが、次の５種類からなる。

(1)

和(Union)
2つの関係RとSの和

は、RのタプルとSのタプルの集合和である。

(2)

差(Difference)
2つの関係RとSの差

は、Rに属しているがSには属していないタプルの集合である。

(3)

直積(Cartesian Product)
2つの関係RとSの直積

は、

で与えられる。

(4)

選択(Selection)
関係Rから条件論理式Cを満足する、Rの部分関係

を取り出す操作を、 CによるRの選択という。これを

と書くことにする。C は属性名,実現値,四則演算子、比較演算子、論理演算子から構成される論理式であり、属性名に実際のタプルの値が代入されてその条件の充足可否が決定される。

(5)

射影(Projection)
関係Rから指定された属性

のみからなる関係Sを作りだす操作である。たとえば表3から名前と趣味による射影は表4 (1) となる。これを

と書く。

以上の基本操作を合成することにより、以下の操作が定義される。

(6): 共通部分(Intersection)
2つの関係RとSに関して、で定義される。
(7): -結合(-Join)
2つの関係RとSがあり、とがそれぞれRとSの属性であったとき、とによるRとSの-結合とは、で与えられる関係のことである。は比較演算子であるが、とくにそれが等号であるとき等結合(equi-join) と呼び、さらにRとSの共通の属性を重複がないように除去したものを自然結合 (natural join)という。
(8): 割算(Division)
2つの関係RとSがあり、それぞれのタプルを、とする。割算は、すべてのに対しがRのタプルであるようなを求める操作である。明らかにである。