論文メモ "One Size Fits All": An Idea Whose Time Has Come and Gone

November 13, 2020

2011年に発表された論文で、これまでのようにDBMSを様々なデータ中心のアプリケーションに利用することがデータベース市場で受け入れられなくなったと主張する。 データウェアハウスとストリーミング処理を例にとり、これらに特化したデータベースをDBMSで代用することの限界が説明されている。 表題の"One Size Fits All"はフリーサイズ、転じて、万能、汎用的を意味する。

関係データベースは、70年代に初めてSQLを実装したSystem Rをもって、市場に登場した。 80年代は、保守コスト、製品間でのアプリケーションの互換性、セールス上の理由から"One Size Fits All"の時代だった。 各社は開発するDBMSの種類を絞り、様々なデータ中心のアプリケーションにDBMSを活用できると信じた。

90年代になると、ビジネスインテリジェンス(BI)がうまれ、社内データを集約し分析するデータウェアハウスが求められるようになった。 データウェアハウスでは、複雑かつアドホックなクエリへの処理性能が求められ、スキーマは星型であり、bitmapインデックスが有効であるのに対し、DBMSでは、更新に特化され、星型スキーマはみられず、B-treeインデックスが効力を発揮する。データウェアハウスをDBMSで代用する難しさがここにある。

交通量や株価などのストリーミング処理では、それに特化したデータベースと比べると、DBMSは処理性能で遅れをとる。 DBMSだと、データを処理するためにはDBにデータを格納する必要がある。 一方、ストリーミングに特化したデータベースでは、受信するデータを永続化する前にメモリー上で処理し、また非同期に永続化できることが処理性能の差を生みだしている。


論文をこちらからダウンロードできます。