一、論文重點內容:



定義relational database一種新的正規畫,其中限制式可以刪掉,只剩下domain和key,稱作domain-key normal form(DK/NF)。接著定義anomaly,包含insertion anomaly(合理的插入一筆資料卻造成relation違反限制式)和deletion anomaly(刪除某一tuple卻造成relation違反限制式),提出許多例子作為anomaly解釋。並且說明當relation是DK/NF時,不會有anomalies出現,反之亦然。





強調自然世界裡所有發生的可能,所以不同於以往只看單一的問題,而考慮了限制式的相互關係造成的影響;並且了解DK/NF是如何轉換形成,了解DK/NF是什麼,要使它一開始形成就是好的,而不是靠事後的操作讓它變好。





整合BCNF、4NF和PJ/NF先前的結果(根據projection和join operators),接著對它們作一些修改,考慮bounded domain size組合的影響,變成BCNF’、4NF’和PJ/NF’來證明,其實和原先BCNF、4NF和PJ/N相同的是沒有定義域範圍是很小的。如果說所有的定義域無限,那麼DK/NF就必須包含所有的正規畫,像是DK/NF→PJ/NF’→4NF’→BCNF’,還有特別以Smith’s normal form也符合同樣的證明結果。並討論一種較弱的DK/NF方法,也就是允許簡單的、除了domain和key的限制式存在。如果資料庫管理系統有能力執行相依但不相關的限制式,此限制式便能夠包含於relational database之中。





二、作者貢獻評論





此篇專題特別重要的突破在於考慮了自然界中所有問題的可能,使得資料庫的運用更貼近生活。特別包括了限制式相互關係影響的結果,使得每一個relation schema資料庫都是DK/NF。他把限制式設定成簡單,使資料庫管理系統能夠快速的處理,而一個好的簡單並且有互相作用的範例應該式包含相依的限制式。





作者針對資料庫的轉換做了很多說明,因為轉換是很複雜的。像是轉換必須是一對一和onto,(不過最近在研究是否轉換可以不是一對一),因為轉換包含傳遞選擇性關係到物件中,而當在DK/NF中轉換的起點和終點若是一致的屬性,就不會有限制的問題。並且當資料彼此相關時,DK/NF就會有內在限制式。除此之外,轉換資料庫還要考慮記憶體的大小和轉換時間以及錯誤頁數,而時間與它的反函數必須是線性。這些對設計資料庫是很重要的注意事項,尤其我們常需要作資料的轉換,以上都必須在過程中考慮進去。





三、心得





作者不同於以往只著重於解決單一問題而發展出1.2.3…階正規化,而是換個角度把問題關鍵的限制式透過簡化刪掉,發展一種只根據domain和key的正規畫relational database,讓很大、很複雜的問題變得簡單而清楚,透過一步步的拆解資料並消除限制式,把問題縮到最小且簡單,包括簡單的限制和簡單的轉換資料庫。而此種方法能夠運用到任何一個正規畫之中,使得每一個資料庫問題都能以簡單的方法解決,讓生活中實際運作的問題都能夠透過此種方法去解決,應用非常廣泛也讓資料庫系統更普及。我覺得作者很厲害,他用很多證明去推導出一個修正原始正規化而發展出的DK/NF,包括重新對正規畫有新的定義,並加以循序漸進找到共同domain、key和constraints的範圍和效用。

arrow
arrow
    全站熱搜

    edting 發表在 痞客邦 留言(0) 人氣()