この規格 プレビューページの目次
※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。
3 用語と定義
このドキュメントの目的のために、ISO 12651-1, ISO 12651-2, ISO 15489-1, および ISO/TR 15801 に記載されている用語と定義、および以下が適用されます。
ISO と IEC は、次のアドレスで標準化に使用する用語データベースを維持しています。
3.1
図書館サービス
情報へのアクセスを処理する ECM システムの管理コンポーネント
3.2
実験
システムから文書を削除し、その文書がシステムに存在したという証拠を残さないプロセス
3.3
半構造化文書
完全にフォーマットされていないテキストまたは構造のないテキストとともに、ある程度の構造と編成の両方を含むドキュメント
例:
手紙、電子メール、自由形式のテキスト コンポーネントを含むフォーム、フォーム。
3.4
構造化文書
厳密な構造または形式に従う文書
例:
テーブル、データベース レコード。
3.5
非構造化文書
事前に定義された構造やフォーマットを持たず、自由形式のテキストを含むドキュメント。同じタイプの他のドキュメントと似ている場合と似ていない場合があり、構造、内容、用語、およびフォーマットが大きく異なります。
3.6
インテリジェントな文書認識
IDR
特定の種類のドキュメントを識別するために使用される情報 (またはデータ) をキャプチャおよび抽出するさまざまな方法を組み込んだテクノロジ。
注記 1: IDR の最も基本的または伝統的な方法は、1990 年代後半から使用されており、バーコード、パッチ コード、およびその他の手動インデックス作成方法の処理が組み込まれています。この技術の現在の世代は、より高度な技術、技術、およびアルゴリズムを自己学習に組み込むこともできます。つまり、処理ルールを更新して、ユーザーの介入なしにデータを分類または抽出することができますが、自然言語処理 (NLP) と呼ばれる言語アルゴリズムを必要とするものもあります。 )、構造化されていないコンテンツを処理します。 IDR は、使用されている技術の範囲内で、コンテンツ (スキャンされたドキュメントおよびデジタル生成) をキャプチャし、ドキュメントからコンテンツを抽出するプロセスを説明するために使用される一般的なマーケティング用語です。
3.7
自然言語処理
NLP
音声データ (コール センターなど) および自由形式のテキスト (電子メールの本文など) を処理する際に、キーワードやフレーズを決定および識別するために使用される技術。
注記 1:この技術は、単語を基本構造に縮小し、ステミングなどの他のアクションを実行するとともに、ユーザーの介入なしに類似の単語または句を見つけることができます。このテクノロジーは、技術的な介入を必要とせずにユーザーが決定したルールを自動的に更新できるため、標準の IDR テクノロジーとは大きく異なります。このテクノロジは、構造化されていないドキュメントに最適です。
参考文献
| [1] | ISO 5457, 技術製品ドキュメント — 図面シートのサイズとレイアウト |
| [2] | ISO 6428, 技術図面 — マイクロコピーの要件 |
| [3] | ISO 10196, ドキュメント イメージング アプリケーション — オリジナル ドキュメントの作成に関する推奨事項 |
| [4] | ISO 10244, ドキュメント管理 — ビジネス プロセスのベースラインと分析 |
| [5] | ISO 12029, ドキュメント管理 — 機械可読紙フォーム — 使いやすさと電子ドキュメント管理システム (EDMS) のための最適な設計 |
| [6] | ISO/TR 12033, ドキュメント管理 — 電子画像処理 — ドキュメント画像圧縮方法の選択に関するガイダンス |
| [7] | ISO/TR 12037, 電子イメージング — 追記型光メディアに記録された情報の抹消に関する勧告 |
| [8] | ISO 1265, 電子イメージング — オフィス文書のスキャンのテスト ターゲット |
| [9] | ISO/TR 12654, 電子イメージング — WORM 光ディスクに証拠として必要とされる可能性のある文書を記録するための電子記録システムの管理に関する推奨事項 |
| [10] | ISO 13008, 情報および文書 — デジタル記録の変換および移行プロセス |
| [11] | ISO/TR 14105, 文書管理 — 電子文書管理システム (EDMS) の実装を成功させるための変更管理 |
| [12] | ISO 15836-1, 情報と文書 — ダブリン コア メタデータ要素セット — 1: コア要素 |
| [13] | ISO 1617, 情報と文書 — 電子オフィス環境における記録の原則と機能要件 |
| [14] | ISO 17068, 情報とドキュメント — デジタル記録のための信頼できるサードパーティのリポジトリ |
| [15] | ISO 18759, 2ドキュメント管理 — 信頼できるストレージ サブシステム (TSS) の機能および技術要件 |
| [16] | ISO 18829, ドキュメント管理 — ECM/EDRM 実装の評価 — 信頼性 |
| [17] | ISO 1900, ドキュメント管理 — 長期保存用の電子ドキュメント ファイル形式 |
| [18] | ISO/TR 22957, 文書管理 — 電子文書管理システム (EDMS) の分析、選択、および実装 |
| [19] | ISO 2308, 情報および文書 — 記録管理プロセス — 記録のメタデータ |
| [20] | ISO 30300, 情報と文書 - 記録の管理システム - 基礎と語彙 |
| [21] | ISO 3200, ドキュメント管理 — ポータブル ドキュメント形式 |
| [22] | ISO/IEC 1381, 情報技術 — 動画および関連する音声情報の一般的なコーディング |
| [23] | ISO/IEC 1449, 情報技術 — 視聴覚オブジェクトのコーディング |
| [24] | ISO/IEC 27001, 情報技術 - セキュリティ技術 - 情報セキュリティ管理システム - 要件 |
| [25] | ISO/IEC 27002, 情報技術 — セキュリティ技術 — 情報セキュリティ管理のための実施基準 |
| [26] | ISO/IEC 27038, 情報技術 - セキュリティ技術 - デジタル編集の仕様 |
| [27] | Workflow Management Coalitio, アプリケーション プログラミング インターフェイス (インターフェイス 2 および 3) |
| [28] | WFMC-TC-1015, Workflow Management Coalitio, 監査データ仕様、1998 年 9 月 22 日、バージョン 1.1 |
| [29] | Workflow Management Coalitio, 相互運用性、インターネット、電子メール MIME バインディング |
| [30] | WFMC-TC-1025 、 Workflow Management Coalition (WfMC) Workflow Standard — Process Definition Interface — XML Process Definition Language, 2005 年 10 月 3 日、バージョン 2.00 |
3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO 12651-1, ISO 12651-2, ISO 15489-1 and ISO/TR 15801 and the following apply.
ISO and IEC maintain terminological databases for use in standardization at the following addresses:
3.1
library services
administrative components of the ECM system that handle access to information
3.2
expungement
process of removing a document from a system and leaving no evidence of the document ever having appeared on the system
3.3
semi-structured document
document that contains both some level of structure and organization along with completely unformatted text or text without any structure
EXAMPLE:
Letters, emails, forms with free-form text components, forms.
3.4
structured document
document that follows a strict structure or format
EXAMPLE:
Table, database record.
3.5
unstructured document
document that has no pre-defined structure or format and contains free-form text, which may or may not be similar to other documents of the same type, and varies greatly in structure, content, terminology and format
3.6
intelligent document recognition
IDR
technology that incorporates various methods of capturing and extracting information (or data) used to identify a specific type of document and data extraction with minimal (or no) user intervention required
Note 1 to entry: The most basic or traditional method of IDR has been in use since the late 1990s and incorporates the processing of barcodes, patch codes and other manual indexing methodologies. The current generations of this technology can also incorporate more advanced technology, techniques and algorithms to self-teach, i.e. to update the processing rules to classify or to extract data without user intervention, while others require linguistic algorithms, referred to natural language processing (NLP), to process unstructured content. IDR is a common marketing term used to describe the process of capturing content (scanned documents and digital born) and extracting content from the document within the limits of the technology being used.
3.7
natural language processing
NLP
technology used to determine and identify key words and phrases within processing audio data (e.g. call centres) and free-form text (e.g. the body of an email)
Note 1 to entry: This technology is able to reduce words to their base constructs and perform other actions, such as stemming, along with locating similar words or phrases without user intervention. This technology also varies greatly from standard IDR technology due to the ability to automatically update rules as determined by the users without the need for technical intervention. This technology is best suited for unstructured documents.
Bibliography
| [1] | ISO 5457, Technical product documentation — Sizes and layout of drawing sheets |
| [2] | ISO 6428, Technical drawings — Requirements for microcopying |
| [3] | ISO 10196, Document imaging applications — Recommendations for the creation of original documents |
| [4] | ISO 10244, Document management — Business process baselining and analysis |
| [5] | ISO 12029, Document management — Machine-readable paper forms — Optimal design for user friendliness and electronic document management systems (EDMS) |
| [6] | ISO/TR 12033, Document management — Electronic imaging — Guidance for the selection of document image compression methods |
| [7] | ISO/TR 12037, Electronic imaging — Recommendations for the expungement of information recorded on write-once optical media |
| [8] | ISO 12653 (all parts), Electronic imaging — Test target for scanning of office documents |
| [9] | ISO/TR 12654, Electronic imaging — Recommendations for the management of electronic recording systems for the recording of documents that may be required as evidence, on WORM optical disk |
| [10] | ISO 13008, Information and documentation — Digital records conversion and migration process |
| [11] | ISO/TR 14105, Document management — Change management for successful electronic document management system (EDMS) implementation |
| [12] | ISO 15836-1, Information and documentation — The Dublin Core metadata element set — 1: Core elements |
| [13] | ISO 16175 (all parts), Information and documentation — Principles and functional requirements for records in electronic office environments |
| [14] | ISO 17068, Information and documentation — Trusted third party repository for digital records |
| [15] | ISO 18759, 2Document management — Trusted storage sub-system (TSS) functional and technical requirements |
| [16] | ISO 18829, Document management — Assessing ECM/EDRM implementations — Trustworthiness |
| [17] | ISO 19005 (all parts), Document management — Electronic document file format for long-term preservation |
| [18] | ISO/TR 22957, Document management — Analysis, selection and implementation of electronic document management systems (EDMS) |
| [19] | ISO 23081 (all parts), Information and documentation — Records management processes — Metadata for records |
| [20] | ISO 30300, Information and documentation — Management systems for records — Fundamentals and vocabulary |
| [21] | ISO 32000 (all parts), Document management — Portable document format |
| [22] | ISO/IEC 13818 (all parts), Information technology — Generic coding of moving pictures and associated audio information |
| [23] | ISO/IEC 14496 (all parts), Information technology — Coding of audio-visual objects |
| [24] | ISO/IEC 27001, Information technology — Security techniques — Information security management systems — Requirements |
| [25] | ISO/IEC 27002, Information technology — Security techniques — Code of practice for information security controls |
| [26] | ISO/IEC 27038, Information technology — Security techniques — Specification for digital redaction |
| [27] | Workflow Management Coalition (WfMC), Application programming interface (Interface 2 and 3) |
| [28] | WFMC-TC-1015, Workflow Management Coalition (WfMC), Audit data specification, 22 Sep 1998, Version 1.1 |
| [29] | Workflow Management Coalition (WfMC), Interoperability, internet, email MIME binding |
| [30] | WFMC-TC-1025, Workflow Management Coalition (WfMC) Workflow Standard — Process Definition Interface — XML Process Definition Language, October 3, 2005, Version 2.00 |