ISO/IEC 14496-17:2006 情報技術—視聴覚オブジェクトのコーディング—パート17:ストリーミングテキスト形式 | ページ 2

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

序文

ISO (国際標準化機構) と IEC (国際電気標準会議) は、世界標準化のための専門システムを形成しています。 ISO または IEC のメンバーである国家機関は、技術活動の特定の分野を扱うために、それぞれの組織によって設立された技術委員会を通じて、国際規格の開発に参加しています。 ISO と IEC の技術委員会は、相互に関心のある分野で協力しています。 ISO および IEC と連携して、政府および非政府の他の国際機関もこの作業に参加しています。情報技術の分野では、ISO と IEC が合同技術委員会 ISO/IEC JTC 1 を設立しました。

国際規格は、ISO/IEC 指令で指定された規則に従って起草されます。 2.

合同技術委員会の主な任務は、国際規格を作成することです。合同技術委員会によって採択された国際規格草案は、投票のために各国の機関に回覧されます。国際規格として発行するには、投票を行う国の機関の少なくとも 75% による承認が必要です。

このドキュメントの要素の一部が特許権の対象となる可能性があることに注意してください。 ISO および IEC は、そのような特許権の一部またはすべてを特定する責任を負わないものとします。

ISO/IEC 14496-17 は、合同技術委員会 ISO/IEC JTC 1, 情報技術、小委員会 SC 29, オーディオ、画像、マルチメディア、およびハイパーメディア情報のコーディングによって作成されました。

ISO/IEC 14496 は、以下の部分で構成されており、一般的なタイトルは「情報技術 — 視聴覚オブジェクトのコーディング」です

  • Part 1: システム
  • Part 2: ビジュアル
  • Part 3: オーディオ
  • Part 4: 適合性テスト
  • Part 5: リファレンス ソフトウェア
  • Part 6: 配信マルチメディア統合フレームワーク (DMIF)
  • Part 7: 視聴覚オブジェクトのコーディング用に最適化されたリファレンス ソフトウェア[テクニカル レポート]
  • Part 8: IP ネットワークを介した ISO/IEC 14496 コンテンツの伝送
  • Part 9: 参照ハードウェアの説明[テクニカル レポート]
  • Part 10: 高度なビデオ コーディング (AVC)
  • Part 11: シーン記述とアプリケーション エンジン
  • Part 12: ISO ベースのメディア ファイル形式
  • Part 13: 知的財産の管理と保護 (IPMP) 拡張機能
  • Part 14: MP4 ファイル形式
  • Part 15: Advanced Video Coding (AVC) ファイル形式
  • Part 16: アニメーション フレームワーク拡張 (AFX)
  • Part 17: ストリーミング テキスト形式
  • Part 18: フォントの圧縮とストリーミング
  • Part 19: 合成テクスチャ ストリーム
  • Part 20: Lightweight Application Scene Representation (LASeR) と Simple Aggregation Format (SAF)
  • Part 21: MPEG-J GFX
  • Part 22: オープン フォント形式

序章

この国際規格は、オーディオビジュアル プレゼンテーション内のマルチメディア コンポーネントの 1 つとして、非常に低いビットレートでテキストをコーディングするための一般的な方法の必要性に応えて開発されました。この国際標準では、たとえば、字幕やカラオケの曲のテキストを別のテキスト ストリームとしてコーディングし、転送して、オーディオビジュアル プレゼンテーションの他のコンポーネントと組み合わせて、IP を介したモバイル サービスで使用するのに十分な低ビットレートで表示できるようにします。

1 スコープ

この国際規格は、画面上で時間指定された表示のためのテキスト情報のコード化された表現を指定します。テキストは、ビデオとオーディオに関連してストリーミングすることができます。この場合、テキストは、関連するオーディオを別の言語に翻訳したり、難聴者への補助として字幕を表すことができます。もう 1 つの例は、カラオケ アプリケーションの曲のテキストです。ただし、テキストは、関連付けられたビデオやオーディオなしでスタンドアロン アプリケーションとしてストリーミングすることもできます。ストリーミング テキスト形式は、トランスポートに依存しない方法で指定され、さまざまなトランスポート手段でのトランスポートを可能にすると同時に、妥当なレベルのランダム アクセスとエラーの堅牢性を提供します。

テキスト ストリームは、指定された形式のテキスト アクセス ユニットを運ぶことができるバイト ストリームとして定義され、テキスト ストリームのデコードに必要なデータがオプションでインターリーブされます。テキスト ストリームとテキスト アクセス ユニットの形式、およびテキスト ストリームのシグナリングとデコードが指定されています。

2 参考文献

本書の適用には、以下の参考文献が不可欠です。日付のある参考文献については、引用された版のみが適用されます。日付のない参照については、参照文書の最新版 (修正を含む) が適用されます。

  • ISO/IEC 14496-18:2004, 情報技術 — 視聴覚オブジェクトのコーディング — 18: フォントの圧縮とストリーミング
  • 3GPP TS 26.245: 2003, 時限テキスト形式 (リリース 6)

3 用語と定義

このドキュメントでは、次の用語と定義が適用されます。

3.1

テキストストリーム

指定された形式のテキスト アクセス ユニットを伝送できるバイト ストリーム。オプションで、テキスト ストリームのデコードに必要なデータとインターリーブされます。

3.2

テキスト アクセス ユニット

テキスト ストリーム内のデータの個別にアクセス可能な部分

注記 1各テキスト アクセス ユニットには、テキスト データのコード化された表現が含まれます。プレゼンテーションでは、テキスト アクセス ユニットを 1 つのタイム スタンプに関連付けることができます。

3.3

3GPP テキスト ストリーム

3GPP テキスト アクセス ユニットを伝送するテキスト ストリーム

3.4

3GPP テキスト アクセス ユニット

3GPP によって指定されたテキスト サンプルからのデータを運ぶテキスト アクセス ユニット

3.5

テキストサンプル

3GPP テキスト ストリームのコンテキストで使用される場合、3GPP TS 26.245 で指定されているテキスト サンプルは、テキスト文字列で構成され、オプションで 1 つまたは複数のテキスト修飾子が続きます。

3.6

文字列

3GPP テキスト ストリームのコンテキストで使用される場合、3GPP TS 26.245 で指定されているように、UTF-8 または UTF-16 を使用してエンコードされた文字列を表すテキスト サンプル内のデータ

3.7

テキスト修飾子

3GPP テキスト ストリームのコンテキストで使用される場合、テキスト サンプル内のデータ。3GPP TS 26.245 で指定されているように、そのテキスト サンプル内のテキスト文字列の表示に対する変更を指定します。

3.8

サンプル概要

3GPP TS 26.245 で指定されているように、3GPP テキスト ストリームのコンテキストで使用される場合、説明テキスト データは、使用されるフォントやテキストの配置など、1 つまたは複数のテキスト サンプルに関するグローバルな情報を提供します。

3.9

時限テキストユニット

ツゥ

テキスト アクセス ユニットを運ぶための 3GPP テキスト ストリーム内の構文構造。そのインデックスjは、どのタイプのデータ (完全なテキスト アクセス ユニット、そのフラグメント、またはサンプル記述など) が運ばれるかを識別します。

参考文献

[1]MPEG-2 システム: ITU-T Rec. H.262 | ISO/IEC 13818-1, 情報技術 - 動画および関連する音声情報の汎用コーディング - 1: システム
[2]IETF RFC 3550, RTP, リアルタイム アプリケーションのトランスポート プロトコル
[3]IETF RFC 3640, 一般的な MPEG-4 コンテンツの転送用の RTP ペイロード
[4]IETF RFC 4396, 3GPP Timed Text の RTP ペイロード

Foreword

ISO (the International Organization for Standardization) and IEC (the International Electrotechnical Commission) form the specialized system for worldwide standardization. National bodies that are members of ISO or IEC participate in the development of International Standards through technical committees established by the respective organization to deal with particular fields of technical activity. ISO and IEC technical committees collaborate in fields of mutual interest. Other international organizations, governmental and non-governmental, in liaison with ISO and IEC, also take part in the work. In the field of information technology, ISO and IEC have established a joint technical committee, ISO/IEC JTC 1.

International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, 2.

The main task of the joint technical committee is to prepare International Standards. Draft International Standards adopted by the joint technical committee are circulated to national bodies for voting. Publication as an International Standard requires approval by at least 75 % of the national bodies casting a vote.

Attention is drawn to the possibility that some of the elements of this document may be the subject of patent rights. ISO and IEC shall not be held responsible for identifying any or all such patent rights.

ISO/IEC 14496-17 was prepared by Joint Technical Committee ISO/IEC JTC 1, Information technology, Subcommittee SC 29, Coding of audio, picture, multimedia and hypermedia information.

ISO/IEC 14496 consists of the following parts, under the general title Information technology — Coding of audio-visual objects:

  • Part 1: Systems
  • Part 2: Visual
  • Part 3: Audio
  • Part 4: Conformance testing
  • Part 5: Reference software
  • Part 6: Delivery Multimedia Integration Framework (DMIF)
  • Part 7: Optimized reference software for coding of audio-visual objects [Technical Report]
  • Part 8: Carriage of ISO/IEC 14496 contents over IP networks
  • Part 9: Reference hardware description [Technical Report]
  • Part 10: Advanced Video Coding (AVC)
  • Part 11: Scene description and application engine
  • Part 12: ISO base media file format
  • Part 13: Intellectual Property Management and Protection (IPMP) extensions
  • Part 14: MP4 file format
  • Part 15: Advanced Video Coding (AVC) file format
  • Part 16: Animation Framework eXtension (AFX)
  • Part 17: Streaming text format
  • Part 18: Font compression and streaming
  • Part 19: Synthesized texture stream
  • Part 20: Lightweight Application Scene Representation (LASeR) and Simple Aggregation Format (SAF)
  • Part 21: MPEG-J GFX
  • Part 22: Open Font Format

Introduction

This International Standard was developed in response to the need for a generic method for coding of text at very low bitrate as one of the multimedia components within audiovisual presentations. This International Standard allows for example subtitles and Karaoke song texts to be coded and transported as separate text streams for presentation jointly with other components of an audiovisual presentation at bitrates that are sufficently low for use in mobile services over IP.

1 Scope

This International Standard specifies the coded representation of textual information for timed presentation on screens. The text may be streamed in association with video and audio, in which case the text may represent subtitles e.g. with translations of the associated audio in another language, or as an aid to the hard of hearing; another example is the text of a song in a Karaoke application. However, the text may also be streamed as a stand-alone application without any associated video and audio. The streaming text format is specified in a transport agnostic manner, so as to allow transport over a large variety of transport means, while providing a reasonable level of random access and error robustness.

The text streams are defined as byte streams that are capable of carrying text access units of a specified format, optionally interleaved with data needed for the decoding of the text stream. The format of text streams and text access units is specified, as well as signaling and decoding of text streams.

2 Normative references

The following referenced documents are indispensable for the application of this document. For dated references, only the edition cited applies. For undated references, the latest edition of the referenced document (including any amendments) applies.

  • ISO/IEC 14496-18:2004, Information technology — Coding of audio-visual objects — 18: Font compression and streaming
  • 3GPP TS 26.245: 2003, Timed text format (Release 6)

3 Terms and definitions

For the purposes of this document, the following terms and definitions apply.

3.1

text stream

byte stream capable of carrying text access units of a specified format, optionally interleaved with data needed for the decoding of the text stream

3.2

text access unit

individually accessible portion of data within a text stream

Note 1 to entry: Each text access unit contains the coded representation of text data. For presentation, the text access unit can be associated with a single time stamp.

3.3

3GPP text stream

text stream carrying 3GPP text access units

3.4

3GPP text access unit

text access unit carrying data from a text sample specified by 3GPP

3.5

text sample

when used in the context of a 3GPP text stream, a text sample, as specified in 3GPP TS 26.245, consisting of a text string, optionally followed by one or more text modifiers

3.6

text string

when used in the context of a 3GPP text stream, data within a text sample, representing a string of characters encoded using UTF-8 or UTF-16, as specified in 3GPP TS 26.245

3.7

text modifier

when used in the context of a 3GPP text stream, data within a text sample, specifying a modification to the presentation of the text string within that text sample, as specified in 3GPP TS 26.245

3.8

sample description

when used in the context of a 3GPP text stream, descriptive text data, providing global information about one or more text samples, such as font(s) to be used and positioning of the text, as specified in 3GPP TS 26.245

3.9

Timed Text Unit

TTU

syntactical structure within a 3GPP text stream for carriage of text access units, whereby its index j identifies which type of data (such as a complete text access unit, a fragment thereof or a sample description) is carried

Bibliography

[1]MPEG-2 Systems: ITU-T Rec. H.262 | ISO/IEC 13818-1, Information technology – Generic coding of moving pictures and associated audio information – 1: Systems
[2]IETF RFC 3550, RTP, A Transport Protocol for Real Time Applications
[3]IETF RFC 3640, RTP payload for transport of generic MPEG-4 content
[4]IETF RFC 4396, RTP payload for 3GPP Timed Text