【中小企業診断士 経営情報システム】半構造化データとは?JSON・XML・YAMLの違いを解説(令和5年 第4問)

 

はじめに

近年の中小企業診断士試験では、構造化データ以外にも「半構造化データ」や「非構造化データ」といったデータ形式の理解が問われるようになっています。

この記事では、令和5年度 経営情報システム 第4問の過去問をもとに、以下の点を中心に解説していきます。

  • 半構造化データの定義と特徴
  • 構造化・非構造化データとの違い
  • JSON・XML・YAMLの比較と代表例の識別
  • 中小企業診断士試験での出題意図と学習ポイント

構造化/半構造化/非構造化データの違いとは?

構造化データ(Structured Data)

あらかじめスキーマ(構造)が厳密に定義されたデータ。RDB(リレーショナルデータベース)の表などが代表例です。

例: 顧客マスタ、商品マスタなど

非構造化データ(Unstructured Data)

構造がなく、機械的な解析が難しいデータ。画像・音声・動画・自然言語テキストなどが該当します。

例: 写真、動画、録音、SNSの投稿文など

半構造化データ(Semi-structured Data)

スキーマは固定されていないが、タグやキーによって構造を柔軟に表現できるデータ形式

例:

  • JSON(JavaScript Object Notation)
  • XML(eXtensible Markup Language)
  • YAML(YAML Ain’t Markup Language)

過去問:令和5年度 経営情報システム 第4問

近年、デジタルデータの多様化に伴い、構造化データに加えて半構造化データならびに非構造化データの利活用の重要性が高まっている。半構造化データの例として、最も適切な組み合わせを下記の解答群から選べ。
 なお、ここで半構造化データとは、あらかじめスキーマを定義せず、データにキーやタグなどを付加することで、データ構造を柔軟に定義できるデータをいう。

a 音・画像・動画データ
b リレーショナルデータベースの表
c JSON形式のデータ
d XML形式のデータ
e YAML形式のデータ

【解答群】
ア:aとbとe
イ:aとcとd
ウ:aとcとe
エ:bとdとe
オ:cとdとe

 

 

 

正解と解説を表示
選択肢 データ形式 分類 補足説明
音・画像・動画 非構造化データ 構造情報がないため半構造化には該当しない
RDBの表 構造化データ スキーマ定義済、表形式で厳格な構造
JSON形式 半構造化データ キー・値ペアで柔軟な構造を記述可能
XML形式 半構造化データ タグにより階層的な構造を記述
YAML形式 半構造化データ JSONと同様、柔軟で可読性の高い形式

✅ 正解:オ(cとdとe)

まとめ

この設問のポイントは、「半構造化データとは何か?」という定義と、具体的なデータ形式を結びつけられるかどうかにあります。

  • JSON・XML・YAMLは、タグやキーによって柔軟に構造を持たせられる
  • 画像・動画・音声は構造を持たないため、非構造化データ
  • RDBは明確なスキーマをもつ構造化データ

おわりに

JSONやYAMLは、API、IoT、クラウド環境などの実務で広く活用される形式です。中小企業診断士試験でも、今後「データ利活用」や「DX推進」の文脈で継続的に出題される可能性があります。

今回のような分類問題は、基本用語を正しく押さえておくことで確実に得点できるテーマです。