データベース応用・その他の基礎まとめ【分散DB・データウェアハウス・NoSQLを解説】

データベース応用,その他に関するブログのアイキャッチ画像 データベース
広告

 データベース技術は,企業の情報システムを支える重要な基盤技術であり,基本情報技術者試験をはじめとする情報処理技術者試験でも幅広く出題されます。従来のデータベース管理だけでなく,大規模データの処理や分析など,さまざまな応用技術が発展しています。

データベース応用技術=大規模データの管理・分析・活用を行うための技術

 例えば,複数のコンピューターでデータベースを管理する分散データベースや,大量の企業データを分析に活用するデータウェアハウス,膨大なデータを扱うビッグデータ技術などがあります。また,従来の関係データベースとは異なる仕組みをもつNoSQLデータベースも利用されています。

 このページでは,データベースの応用分野として,分散データベース(2相コミットメント制御),データウェアハウス,ビッグデータ,BI,データレイク,NoSQLなど,試験で頻出となる用語についてシンプルに解説します。

広告

分散データベースとは

 分散データベースとは,データベースを分散配置したものを,1つのデータベースとしてアクセスできるようにしたものをいいます。

※ 複数のコンピューターでデータベースを管理するので,可用性を高めることができる

2相コミットメント制御とは

 2相コミットメント制御とは,分散トランザクションにおいて整合性が保たれるよう,2段階に分けてコミットを行う手法です。(第1フェーズでは)分散トランザクションを行う複数のサイトにコミットが可能であるかを問い合わせ,すべてのサイトがコミット可である場合に,(第2フェーズで)すべてのサイトにコミット指示を出します。

※ 第1フェーズで,1つでもコミット不可のサイトがある場合や,一定時間が経過しても応答のないサイトがある場合は,すべてのサイトにロールバックの指示を出す

2相コミットメント制御に関する説明画像

データウェアハウスとは

 データウェアハウスとは,企業活動により得られた大量のデータを保管したデータベース(あるいはデータベース管理システム)のことをいいます。意思決定支援などに利用します。

※ データウェアハウスを構築するために,さまざまなシステムからデータを集めるが,データの属性などはシステムごとに異なることが多いため統一しなければならない(データクレンジング

※ データマート…データウェアハウスに保管されたデータの一部を,特定の用途や利用部門用などに取り出したもの

OLAP(Online Analytical Processing;オンライン分析処理)とは

 OLAPとは,データベースに保管された大量のデータに対し,さまざまな視点から分析する技術をいいます。

データマイニングとは

 データマイニングとは,データベースに保管された大量のデータに対して統計処理などによる分析を行い,これまでに知られていなかった規則性や因果関係を見つけ出すことをいいます。

ビッグデータとは

 ビッグデータとは,従来のデータベース管理システムなどでは扱いが難しいような巨大なデータをいいます。ビッグデータには,次のような性質があります。

  • Volume(データの大きさ)
  • Variety(データの種類や情報源の多様性)
  • Velocity(入出力や処理の速さ)

BI(Business Intelligence)とは

 BIとは,企業などに蓄積されるデータを分析・加工し,企業の意思決定に活用する手法のことをいいます。

データレイクとは

 データレイクとは,ビッグデータの貯蔵場所のことをいいます。あらゆるデータを元のままの形式で保管します。

※ 業務システムが扱うデータや,文書ファイル,SNSの書き込みなど,多種多様なデータを保管する

広告

NoSQLとは

 NoSQLとは,SQLを使わずにデータを管理する,データベース管理システムのことをいいます。

※ 大規模データや頻繁に発生するトランザクション処理などに対応しやすい

NoSQLのデータモデル(種類と特徴)

キーバリューストアとは

 キーバリューストアは,キー(key)と値(value)を1対1に対応付けて管理するデータモデルです。

ドキュメント指向型とは

 ドキュメント指向型は,複雑な構造のデータ(XMLやJSONなど)を,そのまま管理するデータモデルです。

カラム指向型(列指向型)とは

 カラム指向型は,キーに対して複数のカラム(列)のデータを対応付けて管理するデータモデルです。

グラフ指向型とは

 グラフ指向型は,グラフ理論に基づいてデータの繋がりを表現するデータモデルです。

まとめ

 今回は,データベースの応用分野として,分散データベース(2相コミットメント制御),データウェアハウス,ビッグデータ,BI,データレイク,NoSQLなどについてシンプルにまとめてみました。これらは,基本情報技術者試験などの情報処理技術者試験で単発的に出題されることが多いため,意味と特徴をセットで理解しておくことが重要です。

 理解が進んだら,基本情報技術者試験の過去問題にもチャレンジしてみてください。

広告