Home » database » エンティティの抽出

エンティティの抽出

エンティティの抽出の方法

エンティティの抽出(Entity-extraction)とは、エンティティ(Entity:実体)を抽出(extract)することです。例えば、“社員”や“部門”といったエンティティ(実体、管理対象)を切り出し、“社員”には社員番号、氏名、入社年月日、性別、生年月日などの属性を定義していきます。エンティティの抽出(Entity-extraction)のアプローチとしては、トップダウンアプローチとボトムアップアプローチがあります。

 

トップダウン・アプローチ

対象領域を明確にした後、対象業務全体についてエンティティ(実体、管理対象)を抽出し、分かる範囲で属性を定義していく方法です。エンティティは、上位レベルのドキュメント類である企画書や要件定義書、業務内容に関するユーザーからのヒアリング結果などから抽出します。

 

ボトムアップ・アプローチ

現行システムの画面・帳票・データベースなどからテーブルやデータ項目を抽出してデータ項目をエンティティとしてまとめる方法です。現行システムだけでなく、新たなシステムでの画面や帳票のイメージの中から属性を抽出することもあります。

 

トップダウン・アプローチとボトムアップ・アプローチの長所短所

トップダウン・アプローチとボトムアップ・アプローチはそれぞれ長所及び短所があります。実際の構築現場ではこの2つのアプローチをうまく使い分けることになります。例えば、新規システムの構築を行う場合は、大きく2つの目的が存在すると考えられます。

第一は、現在の部門ごとに分散している情報システムを1つの情報システムに統合すること。

第二は、今後提供予定の新サービスへの対応です。

既存システムの統合にはボトムアップは有効ですが、新サービスへの対応に関しては、現在の帳票も情報システムも存在しないので、ボトムアップでは設計できない可能性があります。

このため、新サービスに関してはトップダウンで実装する必要があります。情報システム構築の現場では、上流フェーズではトップダウンでモデル化を進め、モデルの詳細化をしていく段階で、ボトムアップで分析された詳細情報を当てはめていくことが多いと思います。

 

ボトムアップアプローチの分析方法

ボトムアップアプローチは、既存業務や既存システムのドキュメントを分析します。トップダウンアプローチのINPUTになり得るドキュメント類は以下のようなものが一般的です。

業務フロー

業務全般を俯瞰するためには業務フローを分析します

業務記述書

業務フローを詳細化した文書です。業務フローと併せて分析します

用語集

業界用語や業務用語などをまとめた文書です

業務ルール定義書

業務運営時の規則やルールを定義した文書です

過去のシステム化時のヒアリング議事録

過去に分析した結果があれば参考にします

One thought on “エンティティの抽出

Comments are closed.