ISO 23185:2009 用語リソースの評価とベンチマーク—一般的な概念、原則、および要件 | ページ 2

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

序文

ISO (国際標準化機構) は、各国の標準化団体 (ISO メンバー団体) の世界的な連合です。国際規格の作成作業は、通常、ISO 技術委員会を通じて行われます。技術委員会が設立された主題に関心のある各会員団体は、その委員会に代表される権利を有します。 ISOと連携して、政府および非政府の国際機関もこの作業に参加しています。 ISO は、電気技術の標準化に関するすべての問題について、国際電気標準会議 (IEC) と緊密に協力しています。

国際規格は、ISO/IEC 指令のPart 2 部で規定されている規則に従って作成されます。

技術委員会の主な任務は、国際規格を準備することです。技術委員会によって採択されたドラフト国際規格は、投票のためにメンバー団体に配布されます。国際規格として発行するには、投票するメンバー団体の少なくとも 75% による承認が必要です。

このドキュメントの要素の一部が特許権の対象となる可能性があることに注意してください。 ISO は、そのような特許権の一部または全部を特定する責任を負わないものとします。

ISO 23185 は、技術委員会 ISO/TC 37, 用語およびその他の言語およびコンテンツ リソース、小委員会 SC 2, 用語および辞書編集方法によって作成されました。

序章

グローバル社会は、科学技術主導の多言語情報・知識社会に向けて加速的な発展を遂げており、情報通信技術 (ICT) の影響が全面的に浸透しています。信頼できる言語リソース (テキストおよび音声コーパス、用語集、計算用語集など) は、新興の知識およびコンテンツ産業をサポートするために不可欠です。したがって、技術標準化、品質管理、知的財産権の規制などに見られるように、用語情報はすべての規制活動において重要な要素になりつつあります。

新興のセマンティック Web では、専用および非専用のブラウザーまたは Web サービスが、構造化コンテンツ (つまり、語彙セマンティクスのレベルでのコンテンツ項目のコレクション) を含む Web ベースのデータベースおよびポータルを検索します。ユーザーは、評価されていない情報で過負荷になることをますます望んでいませんが、重要な情報を見逃すことなく、自分の目的に最も適切で信頼できる情報を受け取りたいと考えています。したがって、自動または半自動検索の結果は、ユーザーの要件を満たすために、セマンティック分析によってますます複合化および要約する必要があります。

構造化されたコンテンツの一見多数のコレクションの中に関連情報が見つかった場合、体系的な構文および意味のフィルタリング、選択、および評価のプロセスが行われます。これらのプロセスのある段階で、ブラウザーまたは Web サービスは、優先順位付けと最適化のために収集されている、多かれ少なかれ適切で信頼できる用語データをグローバルに区別する必要があります。

用語データには多くの機能がありますが、その中で最も顕著なものは次のとおりです。

  • 知識表現(概念)、
  • 知識の順序付け(概念分類)、
  • 他の種類の構造化または非構造化コンテンツへのアクセス、および
  • コミュニケーションと知識伝達の手段または要素。

翻訳、ローカリゼーション、コンテンツ管理などの使用と再利用では、リソースの自動または半自動評価とベンチマーク、または用語データの格納に対する体系的なアプローチが必要になります。

1 スコープ

この国際規格は、用語データの効果的な使用に関連する基本的な概念について説明しています。さまざまな用語リソースに適用可能なモデルの一般原則を提供します。モデルを構成する使いやすさの属性を明確にし、ユーザーの目的を考慮して、用語リソースの全体的な評価のガイドラインを提供します。

2 用語と定義

このドキュメントでは、次の用語と定義が適用されます。

2.1

評価

用語資源(2.8) が指定された要件を満たしていることを実証するプロセス。

2.2

基準

ユーザビリティ属性(usability attribute)(2.11) は, 用語資源(2.8) の ユーザビリティ(2.10) を測定できる基準点又は測定基準として使用される。

2.3

ベンチマーク

用語資源(2.8) toの ベンチマーク(2.2) の適用

2.4

実在物

存在する、存在した、または存在する可能性のある具体的または抽象的なもの。これらのもの間の関連を含む

例:

人、物、出来事、アイデア、プロセスなど。

[出典: ISO/IEC 2382-17:1999, 02/17/05]

2.5

評価モデル

用語資源(2.8) の ユーザビリティ属性(2.11) とそれらの相互関係を識別するモデル。

2.6

特殊言語

主題分野で使用され、表現の特定の言語的手段の使用によって特徴付けられる言語

[出典: ISO 1087-1:2000, 定義 3.1.3]

2.7

用語データ

概念またはその呼称に関するデータ

[出典: ISO 1087-1:2000, 定義 3.8.1]

2.8

用語リソース

用語データリソース

データをグループ化/構造化するか、データをアプリケーションに組み込むことによって生成される ユーザビリティ属性 (2.11) を持つ 用語データ (2.7) のコレクションで構成される エンティティ (2.4) 。

注記 1:用語資源は一般に,構造化された 用語データ (2.7) を含む (用語データベースなど),マークアップ言語でマークアップされた (XML データファイルなど) か,構造化されたレイアウトに関連付けられた (辞書など) )。用語リソースには、最新のコンテンツ処理技術を利用して、そこから使用可能な用語データを抽出できるプレーン テキスト (例: 識別可能な言語スタイルのテキスト) を含めることもできます。

注記2一般に、専門的な用語活動を通じて作成された用語リソースは、よく整理され構造化された高品質の 用語データ (2.7) を備えているため、十分な ユーザビリティ属性 (2.11) を備えています。他のプロセスや活動を通じて作成された用語リソースは、多くの場合、予測できない品質と使いやすさを備えています。

2.9

用語

1つの 特別な言語(2.6) に属する概念に適用される呼称のセット

注記 1 ISO 1087-1 の定義は、「1 つの特殊言語に属する名称のセット」です (ISO 1087-1:2000, 定義 3.5.1)

2.10

使いやすさ

目標を効果的、効率的かつ満足のいく形で達成するためにエンティティを使用できる程度

2.11

使いやすさの属性

ユーザビリティ(2.10) に関連する 用語データ(2.7) のプロパティ

注記1:ユーザビリティ属性は、測定可能または測定不可能として区別することができます。測定可能なユーザビリティ属性は定量的に測定できますが、測定不可能なユーザビリティ属性は定性的に説明する必要があります。

注記2ユーザビリティ属性は、指定された要件に従って記述されるか、または所定の基準に基づいて測定されます。

参考文献

[1]ISO 63, 言語の名前を表すためのコード
[2]ISO 704, 用語集 — 原則と方法
[3]ISO 860, 用語作業 — 概念と用語の調和
[4]ISO 1087-1:2000, 用語集 - 語彙 - Part 1: 理論と応用
[5]ISO 316, 国とその下位区分の名前を表すためのコード
[6]ISO 9241-11, ビジュアル ディスプレイ ターミナル (VDT) を使用したオフィス ワークの人間工学的要件 — Part 11: 使いやすさに関するガイダンス
[7]ISO 10241:1992, 国際用語規格 — 準備とレイアウト
[8]ISO 1117, 情報技術 - メタデータ レジストリ (MDR)
[9]ISO 12616, 翻訳指向の用語
[10]ISO 12620, 用語およびその他の言語およびコンテンツ リソース — データ カテゴリの仕様と言語リソースのデータ カテゴリ レジストリの管理
[11]ISO 15188, 用語標準化のためのプロジェクト管理ガイドライン
[12]ISO 15924, 情報と文書 — スクリプト名の表現のためのコード
[13]ISO 16642:2003, 用語におけるコンピュータ アプリケーション — 用語マークアップ フレームワーク
[14]ISO 30042, 用語、知識、およびコンテンツを管理するシステム — TermBase eXchange (TBX)
[15]ISO/IEC 指令、 Part 2 部、国際規格の構造と起草に関する規則
[16]ISO/IEC 2382-17:1999, 情報技術 — 語彙 — Part 17: データベース
[17]ISO/IEC 912, ソフトウェア エンジニアリング — 製品の品質
[18]BCP 47, IETF 業界標準

Foreword

ISO (the International Organization for Standardization) is a worldwide federation of national standards bodies (ISO member bodies). The work of preparing International Standards is normally carried out through ISO technical committees. Each member body interested in a subject for which a technical committee has been established has the right to be represented on that committee. International organizations, governmental and non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely with the International Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.

International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, Part 2.

The main task of technical committees is to prepare International Standards. Draft International Standards adopted by the technical committees are circulated to the member bodies for voting. Publication as an International Standard requires approval by at least 75 % of the member bodies casting a vote.

Attention is drawn to the possibility that some of the elements of this document may be the subject of patent rights. ISO shall not be held responsible for identifying any or all such patent rights.

ISO 23185 was prepared by Technical Committee ISO/TC 37, Terminology and other language and content resources, Subcommittee SC 2, Terminographical and lexicographical working methods.

Introduction

Global society is undergoing an accelerated development towards becoming a science- and technology-driven multilingual information and knowledge society characterized by the all-pervading influence of information and communication technology (ICT). Reliable language resources (such as text and speech corpora, terminologies, computational lexicons, etc.) are essential to support the emerging knowledge and content industries. Terminology information is thus becoming a key element in all regulatory activities, as seen, for example, in technical standardization, quality management and regulation of intellectual property rights.

In the emerging semantic web, dedicated and non-dedicated browsers or web services search web-based databases and portals containing structured content (i.e. collections of content items at the level of lexical semantics). The user increasingly does not want to be overburdened with non-evaluated information, but to receive the most pertinent and reliable information for his/her purpose without missing important information. The results of automatic or semi-automatic searches, therefore, will increasingly have to be compounded and condensed by semantic analyses in order to meet user requirements.

If seemingly relevant information is found in a multitude of collections of structured content, systematic syntactic and semantic filtering, selection and evaluation processes take place. At some stage of these processes, browsers or web services have to globally distinguish between more or less pertinent and reliable terminological data as it is being collected for the sake of prioritization and optimization.

Terminological data can have many functions, the most prominent of which are

  • knowledge representation (concept),
  • knowledge ordering (concept classification),
  • access to other kinds of structured or unstructured content, and
  • means or elements of communication and knowledge transfer.

For uses and reuses such as translation, localization and content management, a systematic approach to automatic or semi-automatic assessment and benchmarking of resources or containing terminological data becomes necessary.

1 Scope

This International Standard describes fundamental concepts related to the effective use of terminological data. It provides general principles for a model applicable to a variety of terminological resources. It clarifies the usability attributes that constitute the model and provides guidelines for the overall assessment of terminological resources by taking the user’s objectives into account.

2 Terms and definitions

For the purposes of this document, the following terms and definitions apply.

2.1

assessment

process to demonstrate that a terminological resource (2.8) fulfils specified requirements

2.2

benchmark

usability attribute (2.11) used as a reference point or metric against which the usability (2.10) of a terminological resource (2.8) can be measured

2.3

benchmarking

application of benchmarks (2.2) to terminological resources (2.8)

2.4

entity

any concrete or abstract thing that exists, did exist, or might exist, including associations among these things

EXAMPLE:

A person, an object, an event, an idea, a process, etc.

[SOURCE: ISO/IEC 2382-17:1999, 17.02.05]

2.5

model for assessment

model that identifies the usability attributes (2.11) of terminological resources (2.8) and their interrelationships

2.6

special language

language used in a subject field and characterized by the use of specific linguistic means of expression

[SOURCE: ISO 1087-1:2000, definition 3.1.3]

2.7

terminological data

data related to concepts or their designations

[SOURCE: ISO 1087-1:2000, definition 3.8.1]

2.8

terminological resource

terminological data resource

entity (2.4) composed of collections of terminological data (2.7) with the usability attributes (2.11) that are generated by grouping/structuring the data, or incorporating the data into an application

Note 1 to entry: A terminological resource generally contains terminological data (2.7) that are structured (e.g. a terminology database), marked up with a mark-up language (e.g. an XML data file) or associated with a structured layout (e.g. a dictionary). A terminological resource can contain even plain texts (e.g. texts with distinguishable language style) from which usable terminology data can be extracted with the help of modern content-processing technology.

Note 2 to entry: Generally, terminological resources produced through professional terminological activities have well-organized/structured and high-quality terminological data (2.7) and thus have sufficient usability attributes (2.11) . Those terminological resources created through other processes/activities often have unpredictable quality and usability.

2.9

terminology

set of designations applied to concepts belonging to one special language (2.6)

Note 1 to entry: The definition in ISO 1087-1 is “set of designations belonging to one special language” (ISO 1087-1:2000, definition 3.5.1).

2.10

usability

extent to which an entity can be used to achieve goals effectively, efficiently and satisfactorily

2.11

usability attribute

property of terminological data (2.7) related to usability (2.10)

Note 1 to entry: Usability attributes can be distinguished as measurable or non-measurable. Measurable usability attributes can be measured quantitatively, whereas non-measurable usability attributes need to be described qualitatively.

Note 2 to entry: A usability attribute is described according to specified requirements or measured on a given basis.

Bibliography

[1]ISO 639 (all parts), Codes for the representation of names of languages
[2]ISO 704, Terminology work — Principles and methods
[3]ISO 860, Terminology work — Harmonization of concepts and terms
[4]ISO 1087-1:2000, Terminology work — Vocabulary — Part 1: Theory and application
[5]ISO 3166 (all parts), Codes for representation of names of countries and their subdivisions
[6]ISO 9241-11, Ergonomic requirements for office work with visual display terminals (VDTs) — Part 11: Guidance on usability
[7]ISO 10241:1992, International terminology standards — Preparation and layout
[8]ISO 11179 (all parts), Information technology — Metadata registries (MDR)
[9]ISO 12616, Translation-oriented terminography
[10]ISO 12620, Terminology and other language and content resources — Specification of data categories and management of a Data Category Registry for language resources
[11]ISO 15188, Project management guidelines for terminology standardization
[12]ISO 15924, Information and documentation — Codes for the representation of names of scripts
[13]ISO 16642:2003, Computer applications in terminology — Terminological markup framework
[14]ISO 30042, Systems to manage terminology, knowledge and content — TermBase eXchange (TBX)
[15]ISO/IEC Directives, Part 2, Rules for the structure and drafting of International Standards
[16]ISO/IEC 2382-17:1999, Information technology — Vocabulary — Part 17: Databases
[17]ISO/IEC 9126 (all parts), Software engineering — Product quality
[18]BCP 47, IETF Industry Standard