ITパスポート
テクノロジ系
ビッグデータの説明として適切なものはどれか。
1.
大容量のハードディスク
2.
従来の手法では扱いにくい大量・多様・高速なデータ群
✓ 正解
3.
大型のデータセンター
4.
高解像度の画像データ
📝 解説
ビッグデータの説明として適切なものを問う問題です。ビッグデータは単に「データ量が多い」というだけでなく、「従来のデータベースやツールでは処理・分析が困難な大量・多様・高速に生成されるデータ群」を指します。海の例えで考えましょう。従来のデータ(湖)は管理しやすい量でしたが、ビッグデータは「海」のような膨大な量・様々な形(構造化データの表だけでなく、動画・音声・SNS投稿などの非構造化データも含む)・常に流れ込む(リアルタイム生成)というスケールです。ビッグデータの特徴を「3V」と呼びます。Volume(量)=テラバイト・ペタバイト規模、Variety(多様性)=テキスト・画像・音声・センサーデータ等、Velocity(速度)=リアルタイムに高速生成・処理されることです(さらにVeracity(正確性)とValue(価値)を加えた5Vとも言われます)。SNSの投稿データを分析して商品のトレンドを予測、交通センサーデータで渋滞予測、医療データから病気の早期発見などに活用されています。誤答の「大容量のハードディスク」「大型のデータセンター」「高解像度の画像データ」はいずれもビッグデータの定義とは異なります。「ビッグデータ=3V(量・多様性・速度)が特徴の大規模データ群」と覚えましょう!