Neblux 知識グラフ
データベースシステム
データベースシステムは、構造化または半構造化されたデータを格納・照会・管理するための組織的な枠組みであり、大規模環境において一貫性、永続性、効率的なアクセスを保証する。
概要
1970年にEdgar Coddが提案したリレーショナルモデルは、情報を形式的な整合性制約を持つテーブルとして表現し、構造化照会言語による宣告的クエリを可能にすることでデータ管理を変革し、基盤的な存在となった。リレーショナルデータベース管理システムは1970年代以降、ビジネスコンピューティングの基盤となった。リレーショナルシステムと並行して、階層型とネットワーク型モデルがより以前から存在し、文書型、キーバリュー型、カラムファミリ型、グラフ型データベースが2000年代にウェブスケールのワークロードに対応するために登場した。トランザクション管理はACID特性—原子性、一貫性、分離性、永続性—を中心に置き、障害時でも信頼性の高い動作を保証する。クエリオプティマイザーはコストモデルとB木やハッシュインデックスなどのインデックス構造を使用して高レベルSQLを効率的な実行計画に変換し、アルゴリズム的推論でI/Oと計算量を最小化する。約2002年に証明されたCAPの定理は、分散データベースシステムが一貫性、可用性、分割耐性を同時に保証できないことを示した。
なぜ重要か
データベースシステムは銀行、医療記録、電子商取引、科学データリポジトリに至るまで、ほぼすべての重要なソフトウェアアプリケーションを支える重要インフラである。分析データベースの発展により大規模なビジネスインテリジェンスが可能になり、さらに最近では機械学習モデルに供給するデータパイプラインも実現した。NoSQLシステムにより、グローバルなエンジニアリングインフラ全体でペタバイト規模の非構造化データを格納・照会することが実用的になった。データベースシステムの研究はインメモリ処理、ストリーミングデータプラットフォーム、医療や社会科学に関連するプライバシー保護クエリ技術の進歩を引き続き推進している。