Home » database » エンティティの抽出

エンティティの抽出

エンティティの抽出(Entity-extraction)とは、

 

エンティティ(Entity:実体)を抽出(extract)することです。

 

例えば、“社員”や“部門”といったエンティティ(実体、管理対象)を切り出し、

 

“社員”には社員番号、氏名、入社年月日、性別、生年月日などの属性を定義していきます。

 

エンティティの抽出(Entity-extraction)のアプローチとしては、

 

トップダウンアプローチとボトムアップアプローチがあります。

 

◆トップダウン・アプローチ

 

対象領域を明確にした後、対象業務全体についてエンティティ(実体、管理対象)を抽出し、

 

分かる範囲で属性を定義していく方法です。

 

エンティティは、上位レベルのドキュメント類である要件定義書や業務内容に関するユーザーからのヒアリング結果などから抽出します。

 

◆ボトムアップ・アプローチ

 

現行システムの画面・帳票・データベースなどからテーブルやデータ項目を抽出してデータ項目をエンティティとしてまとめる方法です。

 

現行システムだけでなく、新たなシステムでの画面や帳票のイメージの中から属性を抽出することもあります。

 

◆トップダウン・アプローチとボトムアップ・アプローチの長所短所

 

トップダウン・アプローチとボトムアップ・アプローチはそれぞれ長所及び短所があります。

 

実際の構築現場ではこの2つのアプローチをうまく使い分けることになります。

 

例えば、新規システムの構築を行う場合は、大きく2つの目的が存在すると考えられます。

 

1つ目は、現在の部門ごとに分散している情報システムを1つの情報システムに統合すること。

 

もう1つは、今後提供予定の新サービスへの対応です。

 

既存システムの統合にはボトムアップは有効ですが、新サービスへの対応に関しては、現在の帳票も情報システムも存在しないので、

 

ボトムアップでは設計できない可能性があります。

 

このため、新サービスに関してはトップダウンで実装する必要があります。

 

情報システム構築の現場では、上流フェーズではトップダウンでモデル化を進め、

 

モデルの詳細化をしていく段階で、ボトムアップで分析された詳細情報を当てはめていくことが多いと思います。

 

◆トップダウンアプローチのINPUTになり得るドキュメント類は以下のようなものが一般的です。

 

・業務フロー
・業務記述書
・用語集
・業務ルール定義書
・過去のシステム化時のヒアリング議事録