基本情報技術者試験など情報処理技術者試験を受験する方にとっては必須の,データベース応用,その他についてシンプルにまとめています。分散データベース(2相コミットメント制御),データウェアハウス(データマート,データクレンジング,OLAP(オンライン分析処理),データマイニング),ビッグデータ(ビッグデータの性質,データレイク),NoSQL(NoSQLのデータモデル(キーバリューストア,ドキュメント指向型,カラム指向型(列指向型),グラフ指向型))について説明しています。
分散データベース
分散データベースとは,データベースを分散配置したものを,1つのデータベースとしてアクセスできるようにしたものをいいます。
※ 複数のコンピューターでデータベースを管理するので,可用性を高めることができる
2相コミットメント制御
2相コミットメント制御とは,分散トランザクションにおいて整合性が保たれるよう,2段階に分けてコミットを行う手法です。(第1フェーズでは)分散トランザクションを行う複数のサイトにコミットが可能であるかを問い合わせ,すべてのサイトがコミット可である場合に,(第2フェーズで)すべてのサイトにコミット指示を出します。
※ 第1フェーズで,1つでもコミット不可のサイトがある場合や,一定時間が経過しても応答のないサイトがある場合は,すべてのサイトにロールバックの指示を出す
※ コミットについては,「データベース管理システム(DBMS)(物理設計)-データベース管理システム(DBMS;DataBase Management System)-トランザクションの管理-トランザクション -情報処理シンプルまとめ」を参照
データウェアハウス
データウェアハウスとは,企業活動により得られた大量のデータを保管したデータベース(あるいはデータベース管理システム)のことをいいます。意思決定支援などに利用します。
※ データウェアハウスを構築するために,さまざまなシステムからデータを集めるが,データの属性などはシステムごとに異なることが多いため統一しなければならない(データクレンジング)
※ データマート…データウェアハウスに保管されたデータの一部を,特定の用途や利用部門用などに取り出したもの
OLAP(Online Analytical Processing;オンライン分析処理)
OLAPとは,データベースに保管された大量のデータに対し,さまざまな視点から分析する技術をいいます。
データマイニング
データマイニングとは,データベースに保管された大量のデータに対して統計処理などによる分析を行い,これまでに知られていなかった規則性や因果関係を見つけ出すことをいう。
ビッグデータ
ビッグデータとは,従来のデータベース管理システムなどでは扱いが難しいような巨大なデータをいいます。
ビッグデータの性質
- Volume(データの大きさ)
- Variety(データの種類や情報源の多様性)
- Velocity(入出力や処理の速さ)
データレイク
データレイクとは,ビッグデータの貯蔵場所のことをいいます。あらゆるデータを元のままの形式で保管します。
※ 業務システムが扱うデータや,文書ファイル,SNSの書き込みなど,多種多様なデータを保管する
NoSQL
NoSQLとは,SQLを使わずにデータを管理する,データベース管理システムのことをいいます。
※ SQLでは不可能なことや難しい機能を実現することができる(大規模データや頻繁に発生するトランザクション処理など)
NoSQLのデータモデル
キーバリューストア
キーバリューストアは,キー(key)と値(value)を1対1に対応付けて管理するデータモデルです。
ドキュメント指向型
ドキュメント指向型は,複雑な構造のデータ(XMLやJSONなど)を,そのまま管理するデータモデルです。
カラム指向型(列指向型)
カラム指向型は,キーに対して複数のカラム(列)のデータを対応付けて管理するデータモデルです。
グラフ指向型
グラフ指向型は,グラフ理論に基づいてデータの繋がりを表現するデータモデルです。
まとめ
今回は,データベース応用,その他について,シンプルにまとめてみました。各内容を,しっかり理解し,覚えるようにしましょう。