この規格 プレビューページの目次
※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。
序文
ISO (国際標準化機構) と IEC (国際電気標準会議) は、世界標準化のための専門システムを形成しています。 ISO または IEC のメンバーである各国機関は、特定の技術活動分野に対処するためにそれぞれの組織によって設立された技術委員会を通じて国際規格の開発に参加しています。 ISO と IEC の技術委員会は、相互に関心のある分野で協力します。政府および非政府の他の国際機関も、ISO および IEC と連携してこの作業に参加しています。情報技術の分野では、ISO と IEC は共同技術委員会 ISO/IEC JTC 1 を設立しました。
この文書の作成に使用される手順と、そのさらなる保守を目的とした手順は、ISO/IEC 指令第 1 Part に記載されています。特に、さまざまなタイプの ISO 文書に必要なさまざまな承認基準に注意する必要があります。この文書は、ISO/IEC 指令Part 2 部の編集規則に従って起草されました ( www.iso.org/directives を参照)
この文書の要素の一部が特許権の対象となる可能性があることに注意してください。 ISO は、かかる特許権の一部またはすべてを特定する責任を負わないものとします。文書の作成中に特定された特許権の詳細は、序論および/または受け取った特許宣言の ISO リストに記載されます ( www.iso.org/patents を参照)
本書で使用されている商号は、ユーザーの便宜のために提供された情報であり、推奨を構成するものではありません。
適合性評価に関連する ISO 固有の用語や表現の意味の説明、および貿易の技術的障壁 (TBT) における世界貿易機関 (WTO) 原則への ISO の準拠に関する情報については、次の URL を参照してください。 www.iso .org/iso/foreword.html
この文書を担当する委員会は、ISO/IEC JTC 1, 情報技術、サブ委員会 SC 35, ユーザー インターフェイスです。
ISO/IEC 30122 シリーズのすべての部品のリストは、ISO の Web サイトでご覧いただけます。
導入
音声コマンドは、利用者の音声や言語でICT機器を制御するために使用されます。このテクノロジーは音声認識に基づいており、言語耐性 (特定の言語を使用する際のアクセントの違いや音声障害) がある程度考慮されています。また、手や指が使えない場所でICT機器を操作する人にとってもメリットがあります。
この文書は、さまざまな ICT デバイスで一般的に使用される主要な標準化された音声コマンドを定義します。
1 スコープ
この文書は、音声コマンドとその音声認識エンジンの技術的基準とテスト方法を提供します。
技術的基準には、音声コマンドを構成する話し言葉やフレーズの音声要件が含まれます。
テスト方法では、音声コマンドまたは音声認識エンジンが要求仕様を満たしているかどうかを検証します。
2 規範的参照
この文書には規範的な参照はありません。
3 用語と定義
この文書の目的上、次の用語と定義が適用されます。
ISO と IEC は、標準化に使用する用語データベースを次のアドレスで維持しています。
3.1
言葉
特定の意味を伝える最小の言語単位
[出典:ISO 5127:2001, 1.1.2.07, 修正済み]
3.2
音節
直前または直後に 1 つ以上の子音を伴うか伴わない母音で構成される音声セグメント
[出典:ISO 8253-3:2012, 3.8]
3.3
文
述語を含む関連する語形のグループ。通常は完全な思考を表現し、談話構造の基本単位を形成する
[出典:ISO 24615-1:2014, 3.15]
3.4
音声認識
機能単位による、音声信号の音声内容の表現への変換
[出典:ISO/IEC 2382:2015, 2120735, 修正済み]
参考文献
| 1 | ISO 5127:2001, 情報および文書 — 語彙 |
| 2 | ISO 8253-3:2012, 音響学 — 聴力検査方法 — Part 3: 音声聴力検査 |
| 3 | ISO 9241-14, ビジュアル ディスプレイ ターミナル (VDT) を使用したオフィス作業のための人間工学的要件 — Part 14: メニュー ダイアログ |
| 4 | ISO 9241-15, ビジュアル ディスプレイ ターミナル (VDT) を使用したオフィス作業のための人間工学的要件 — Part 15: コマンド ダイアログ |
| 5 | ISO 9241-110, 人間とシステムの相互作用の人間工学 — Part 110: 対話の原則 |
| 6 | ISO 9241-143, 人間とシステムの相互作用の人間工学 — Part 143: フォーム |
| 7 | ISO 24613, 言語リソース管理 - 語彙マークアップ フレームワーク (LMF) |
| 8 | ISO 24614-1, 言語リソース管理 — 書かれたテキストの単語分割 — Part 1: 基本概念と一般原則 |
| 9 | ISO 24615-1:2014, 言語リソース管理 — 構文注釈フレームワーク (SynAF) — Part 1: 構文モデル |
| 10 | ISO/IEC 2382:2015, 情報技術 - 語彙 |
| 11 | ISO/IEC 30122-1, 情報技術 - ユーザー インターフェイス - 音声コマンド - Part 1: フレームワークと一般的なガイダンス |
| 12 | IPSJ-TS 0011:2005, 車載用音声認識システムの評価ガイドライン |
| 13 | JEITA IT-4003:2005, 日本語音声認識装置の記号 |
| 14 | JEITA IT-4005:2008, 音声認識エンジンの性能評価ガイドライン |
| 15 | JEITA IT-4007:2012, 音声認識を備えたアプリケーション システムにおける音声コマンドの設計ガイドライン |
Foreword
ISO (the International Organization for Standardization) and IEC (the International Electrotechnical Commission) form the specialized system for worldwide standardization. National bodies that are members of ISO or IEC participate in the development of International Standards through technical committees established by the respective organization to deal with particular fields of technical activity. ISO and IEC technical committees collaborate in fields of mutual interest. Other international organizations, governmental and non-governmental, in liaison with ISO and IEC, also take part in the work. In the field of information technology, ISO and IEC have established a joint technical committee, ISO/IEC JTC 1.
The procedures used to develop this document and those intended for its further maintenance are described in the ISO/IEC Directives, Part 1. In particular the different approval criteria needed for the different types of ISO documents should be noted. This document was drafted in accordance with the editorial rules of the ISO/IEC Directives, Part 2 (see www.iso.org/directives ).
Attention is drawn to the possibility that some of the elements of this document may be the subject of patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of any patent rights identified during the development of the document will be in the Introduction and/or on the ISO list of patent declarations received (see www.iso.org/patents ).
Any trade name used in this document is information given for the convenience of users and does not constitute an endorsement.
For an explanation on the meaning of ISO specific terms and expressions related to conformity assessment, as well as information about ISO's adherence to the World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT) see the following URL: www.iso.org/iso/foreword.html .
The committee responsible for this document is ISO/IEC JTC 1, Information technology, Subcommittee SC 35, User interfaces.
A list of all parts in the ISO/IEC 30122 series can be found on the ISO website.
Introduction
Voice command is used for controlling ICT devices with the voice and in the language of the user. This technology is based on speech recognition, with some consideration for language tolerance (different accents or speech impairment while using a given language). It is also beneficial to the people who are operating the ICT device when/where they cannot use hands or fingers to operate it.
This document defines the principal standardized voice commands that will be commonly used in various ICT devices.
1 Scope
This document provides the technical criterions and test methods of voice commands and its speech recognition engine.
The technical criterions include the phonetic requirements for spoken words or phrases that compose the voice command.
The test methods verify whether the voice command or speech recognition engine satisfies the required specifications.
2 Normative references
There are no normative references in this document.
3 Terms and definitions
For the purposes of this document, the following terms and definitions apply.
ISO and IEC maintain terminological databases for use in standardization at the following addresses:
3.1
word
smallest linguistic unit conveying a specific meaning
[SOURCE:ISO 5127:2001, 1.1.2.07, modified]
3.2
syllable
segment of speech which consists of a vowel with or without one or more accompanying consonants immediately preceding or following
[SOURCE:ISO 8253-3:2012, 3.8]
3.3
sentence
related group of word forms containing a predication, usually expressing a complete thought and forming the basic unit of discourse structure
[SOURCE:ISO 24615-1:2014, 3.15]
3.4
speech recognition
conversion, by a functional unit, of a speech signal to a representation of the content of the speech
[SOURCE:ISO/IEC 2382:2015, 2120735, modified]
Bibliography
| 1 | ISO 5127:2001, Information and documentation — Vocabulary |
| 2 | ISO 8253-3:2012, Acoustics — Audiometric test methods — Part 3: Speech audiometry |
| 3 | ISO 9241-14, Ergonomic requirements for office work with visual display terminals (VDTs) — Part 14: Menu dialogues |
| 4 | ISO 9241-15, Ergonomic requirements for office work with visual display terminals (VDTs) — Part 15: Command dialogues |
| 5 | ISO 9241-110, Ergonomics of human-system interaction — Part 110: Dialogue principles |
| 6 | ISO 9241-143, Ergonomics of human-system interaction — Part 143: Forms |
| 7 | ISO 24613, Language resource management — Lexical markup framework (LMF) |
| 8 | ISO 24614-1, Language resource management — Word segmentation of written texts — Part 1: Basic concepts and general principles |
| 9 | ISO 24615-1:2014, Language resource management — Syntactic annotation framework (SynAF) — Part 1: Syntactic model |
| 10 | ISO/IEC 2382:2015, Information technology — Vocabulary |
| 11 | ISO/IEC 30122-1, Information technology — User interfaces — Voice commands — Part 1: Framework and general guidance |
| 12 | IPSJ-TS 0011:2005, Guidelines for evaluation of an in-car speech recognition system |
| 13 | JEITA IT-4003:2005, Symbols for Japanese speech recognizer |
| 14 | JEITA IT-4005:2008, The Guidelines for performance evaluation of speech recognition engine |
| 15 | JEITA IT-4007:2012, The Guidelines for Design of Voice Commands in Application Systems with Speech Recognition |