はじめに
近年の中小企業診断士試験では、構造化データ以外にも「半構造化データ」や「非構造化データ」といったデータ形式の理解が問われるようになっています。
この記事では、令和5年度 経営情報システム 第4問の過去問をもとに、以下の点を中心に解説していきます。
- 半構造化データの定義と特徴
- 構造化・非構造化データとの違い
- JSON・XML・YAMLの比較と代表例の識別
- 中小企業診断士試験での出題意図と学習ポイント
構造化/半構造化/非構造化データの違いとは?
構造化データ(Structured Data)
あらかじめスキーマ(構造)が厳密に定義されたデータ。RDB(リレーショナルデータベース)の表などが代表例です。
例: 顧客マスタ、商品マスタなど
非構造化データ(Unstructured Data)
構造がなく、機械的な解析が難しいデータ。画像・音声・動画・自然言語テキストなどが該当します。
例: 写真、動画、録音、SNSの投稿文など
半構造化データ(Semi-structured Data)
スキーマは固定されていないが、タグやキーによって構造を柔軟に表現できるデータ形式。
例:
- JSON(JavaScript Object Notation)
- XML(eXtensible Markup Language)
- YAML(YAML Ain’t Markup Language)
過去問:令和5年度 経営情報システム 第4問
近年、デジタルデータの多様化に伴い、構造化データに加えて半構造化データならびに非構造化データの利活用の重要性が高まっている。半構造化データの例として、最も適切な組み合わせを下記の解答群から選べ。
なお、ここで半構造化データとは、あらかじめスキーマを定義せず、データにキーやタグなどを付加することで、データ構造を柔軟に定義できるデータをいう。
a 音・画像・動画データ
b リレーショナルデータベースの表
c JSON形式のデータ
d XML形式のデータ
e YAML形式のデータ
【解答群】
ア:aとbとe
イ:aとcとd
ウ:aとcとe
エ:bとdとe
オ:cとdとe
正解と解説を表示
選択肢 | データ形式 | 分類 | 補足説明 |
---|---|---|---|
a | 音・画像・動画 | 非構造化データ | 構造情報がないため半構造化には該当しない |
b | RDBの表 | 構造化データ | スキーマ定義済、表形式で厳格な構造 |
c | JSON形式 | 半構造化データ | キー・値ペアで柔軟な構造を記述可能 |
d | XML形式 | 半構造化データ | タグにより階層的な構造を記述 |
e | YAML形式 | 半構造化データ | JSONと同様、柔軟で可読性の高い形式 |
✅ 正解:オ(cとdとe)
まとめ
この設問のポイントは、「半構造化データとは何か?」という定義と、具体的なデータ形式を結びつけられるかどうかにあります。
- JSON・XML・YAMLは、タグやキーによって柔軟に構造を持たせられる
- 画像・動画・音声は構造を持たないため、非構造化データ
- RDBは明確なスキーマをもつ構造化データ
おわりに
JSONやYAMLは、API、IoT、クラウド環境などの実務で広く活用される形式です。中小企業診断士試験でも、今後「データ利活用」や「DX推進」の文脈で継続的に出題される可能性があります。
今回のような分類問題は、基本用語を正しく押さえておくことで確実に得点できるテーマです。