ISO/IEC 13818-7:2006 情報技術—動画および関連するオーディオ情報の一般的なコーディング—パート7:Advanced Audio Coding(AAC) | ページ 5

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

3 用語と定義

ISO/IEC 13818 のこの部分では、次の定義が適用されます。

3.1

アクセスユニット

圧縮オーディオの場合、オーディオ アクセス ユニット

3.2

エイリアス

サンプリングに起因するミラー信号成分

3.3

分析フィルターバンク

広帯域 PCM オーディオ信号を一連のスペクトル係数に変換するエンコーダのフィルタ バンク

3.4

補助データ

補助データの送信に使用されるビットストリームの一部

3.5

オーディオ アクセス ユニット

AAC の場合、それ自体でデコードできるエンコードされたビットストリームの最小部分。デコードとは「完全に再構築されたサウンド」を意味します。

注記 1:通常、これは、1 つの ID_END id_syn_ele() の最後のビットを含むバイトの終わりから始まり、次の ID_END id_syn_ele の最後のビットを含むバイトの終わりまでのエンコードされたビットストリームのセグメントです。

3.6

オーディオバッファ

圧縮された音声データを保存するためのシステム ターゲット デコーダのバッファ (ISO/IEC 13818-1 を参照)

3.7

吠える

人間の聴覚の 1 つの臨界帯域幅に対応する標準単位

3.8

下位互換性

古いコーディング標準で動作するように設計されたデコーダが、新しいコーディング標準に従って生成されたビットストリームのすべてまたは一部をデコードすることによって動作し続けることができる場合、新しいコーディング標準は古いコーディング標準と下位互換性があります。

3.9

ビットレート

圧縮されたビットストリームがデコーダの入力に配信されるレート

3.10

ビットストリーム

ストリーミング

データのコード化表現を形成する順序付けられた一連のビット

3.11

ビットストリーム検証

ISO/IEC 13818 のこの部分で指定されたすべての要件がビットストリームによって満たされていることをテストおよび検証できるプロセス。

3.12

ブロック圧縮

特定の期間内のオーディオ信号のデジタル表現の正規化

3.13

バイト整列

コード化されたビットストリームのビットは、その位置がオーディオ データ交換フォーマット (6.1 を参照) のストリームの最初のビットまたはオーディオ データ トランスポート ストリームの同期ワードの最初のビットのいずれかからの 8 ビットの倍数である場合、バイト整列されます。形式 (6.2 を参照)

3.14

バイト

8 ビットのシーケンス

3.15

センターチャンネル

正面ステレオ画像の中央成分を安定させるために使用されるオーディオ プレゼンテーション チャネル。

3.16

チャネル

1 つのリスニング位置で再生されるオーディオ信号を表す一連のデータ

3.17

コード化されたオーディオ ビットストリーム

オーディオ信号のコード化表現

3.18

コード化された表現

エンコードされた形式で表されるデータ要素

3.19

圧縮

データ項目を表すために使用されるビット数の削減

3.20

固定ビットレート

符号化されたビットストリームの開始から終了までビットレートが一定である操作

3.21

CRC

データの正確性を検証する巡回冗長検査

3.22

臨界帯域

人間の聴覚用語で表される帯域幅の標準単位を表す帯域幅の単位。人間の蝸牛の固定長に対応し、低周波数では約 100 Hz, 高周波数では約 700 Hz 以上で 1/3 オクターブに相当します。

3.23

データ項目

符号化前および復号化後に表されるデータ項目

3.24

デコードされたストリーム

圧縮されたビットストリームのデコードされた再構成

3.25

デコーダ

復号化プロセスの実施形態

3.26

デコード(処理)

ISO/IEC 13818 のこの部分で定義されている、入力コード化ビットストリームを読み取り、デコードされたオーディオ サンプルを出力するプロセス

3.27

デジタル記憶媒体

DSM

デジタルストレージまたは伝送デバイスまたはシステム

3.28

離散コサイン変換

DCT

順離散コサイン変換または逆離散コサイン変換のいずれか、可逆な離散直交変換

3.29

ダウンミックス

nチャネル未満のチャネルを取得するためのnチャネルの行列化

3.30

編集

1 つまたは複数のコード化されたビットストリームを操作して、新しいコード化されたビットストリームを生成するプロセス

注記 1: ISO/IEC 13818 のこの部分では、準拠する編集済みビットストリームが定義されています。

3.31

エンコーダー

符号化プロセスの実施形態

3.32

エンコーディング (プロセス)

入力オーディオ サンプルのストリームを読み取り、ISO/IEC 13818 のこの部分で定義されている有効なコード化されたビットストリームを生成する、ISO/IEC 13818 で指定されていないプロセス。

3.33

エントロピーコーディング

統計的冗長性を減らすための、信号のデジタル表現の可変長無損失符号化

3.34

高速フーリエ変換

FFT

離散フーリエ変換 (直交変換) を実行する高速アルゴリズム

3.35

フィルターバンク

オーディオ周波数範囲全体をカバーするバンドパスフィルターのセット

3.36

国旗

ISO/IEC 13818 のこの部分で定義されている 2 つの値のいずれかを取ることができる変数

3.37

前方互換性

新しいコーディング標準で動作するように設計されたデコーダーが古いコーディング標準のビットストリームをデコードできる場合、新しいコーディング標準は古いコーディング標準と前方互換性があります。

3.38

フレーム

オーディオ アクセス ユニットからのオーディオ PCM サンプルに対応するオーディオ信号の一部

3.39

Fs

サンプリング周波数

3.40

ハン ウィンドウ

フーリエ変換の前にオーディオ サンプルのブロックにサンプルごとに適用される時間関数

3.41

ハフマンコーディング

エントロピー符号化の具体的な方法

3.42

ハイブリッド フィルター バンク

サブバンド フィルターバンクと MDCT のシリアル結合

3.43

IDCT

逆離散コサイン変換

3.44

IMDCT

逆修正離散コサイン変換

3.45

強度ステレオ

右チャンネルと左チャンネルのエネルギー エンベロープのみを高周波数で保持することに基づいて、ステレオ オーディオ プログラムでステレオの無関係性または冗長性を利用する方法

3.46

ジョイントステレオコーディング

立体音響の無関係性または立体音響の冗長性を利用する方法

3.47

ジョイントステレオモード

ジョイント ステレオ コーディングを使用したオーディオ コーディング アルゴリズムのモード

3.48

低周波増強 (LFE) チャンネル

マルチチャンネルシステムにおける低周波オーディオエフェクト用の帯域幅制限チャンネル

3.49

メインオーディオチャンネル

single_channel_element() (8.2.1 を参照) または channel_pair_element() (8.2.1 を参照) のいずれかで表されるすべてのチャネル

3.50

マッピング

サブバンドフィルタリングおよび/またはMDCTによるオーディオ信号の時間ドメインから周波数ドメインへの変換

3.51

マスキング

別の音声信号の存在下で音声信号を知覚できない人間の聴覚系の特性

3.52

マスキングしきい値

人間の聴覚系が音声信号を知覚できない周波数と時間で機能する

3.53

修正離散コサイン変換

MDCT

時間領域のエイリアシング キャンセルの性質を持つ変換

注記 1 MDCT の分析式は C.3.1.2 にある。

3.54

M/S ステレオ

左チャンネルと右チャンネルの代わりに和信号と差信号を符号化することに基づいて、ステレオ オーディオ プログラムでステレオの無関係性または冗長性を利用するだけでなく、イメージング アーティファクトを除去する方法

3.55

マルチチャンネル

空間音場を作成するために使用されるオーディオチャンネルの組み合わせ

3.56

多言語

複数の言語での対話のプレゼンテーション

3.57

非調性成分

オーディオ信号のノイズのような成分

3.58

考慮されるチャネルの数

NCC

MPEG-AACデコーダーとビットストリームの命名規則に関して、要素SCE, 独立して切り替えられるCCEおよびCPEによって表されるチャネルの数。 、NCC=A+I

注記 1この数値は、必要なデコーダ入力バッファサイズを導出するために使用される (8.2.3 を参照)

3.59

ナイキストサンプリング

信号の最大帯域幅の 2 倍以上でのサンプリング

3.60

パディング

条件付きでオーディオ フレームにスロットを追加することにより、オーディオ フレームの平均長を対応する PCM サンプルの持続時間に合わせて調整する方法

3.61

パラメータ

値の範囲の 1 つを取ることができる、この仕様の構文内の変数。 2 つの値のいずれかを取ることができる変数は、フラグまたはインジケーターであり、パラメーターではありません

3.62

パーサー

コード化されたビットストリームからコード化された要素を表す一連のビットを抽出するデコーダの機能段階。

3.63

多相フィルター バンク

フィルタバンクの効率的な実装を可能にする、特別な位相相互関係を持つ等帯域幅フィルタのセット

3.64

予測誤差

サンプルまたはデータ要素の実際の値とその予測子の差

3.65

予測

現在デコードされているサンプル値またはデータ要素の推定値を提供するための予測子の使用

3.66

予測者

以前にデコードされたサンプル値またはデータ要素の線形結合

3.67

プレゼンテーションチャンネル

デコーダー出力の音声チャンネル

3.68

プレゼンテーションユニット

圧縮オーディオの場合は、デコードされたオーディオ アクセス ユニット

3.69

プログラム

メイン オーディオ チャネル、coupling_channel_element, () (8.2.1 を参照)、lfe_channel_element, () (8.2.1 を参照)、およびデコードと再生を同時に行うことを目的とした関連データ ストリームのセット

注記 1:プログラムは、デフォルトで (8.5.3.1 および 8.5.3.3 を参照)、または特に program_config_element, () (8.5.3.2 を参照) によって定義される場合があります。特定の single_channel_element() (8.2.1 を参照)、channel_pair_element, () (8.2.1 を参照)、coupling_channel_element, ()、lfe_channel_element, ()、またはデータ チャネルは、任意のビットストリームで 1 つまたは複数のプログラムに付随する場合があります。

3.70

心理音響モデル

人間の聴覚系のマスキング動作の数学的モデル

3.71

ランダムアクセス

任意の時点でコード化されたビットストリームの読み取りとデコードを開始するプロセス

3.72

予約済み

コード化されたビットストリームを定義する句で使用される場合、値が ISO/IEC で定義された拡張に将来使用される可能性があることを示します。

3.73

サンプリング周波数

Fs

サンプリング プロセス中にオーディオ信号をデジタル化するために使用されるヘルツ単位のレート

3.74

倍率

量子化の前に一連の値をスケーリングする係数

3.75

倍率帯域

1 つの倍率でスケーリングされたスペクトル係数のセット

3.76

倍率指数

倍率の数値コード

3.77

サイド情報

デコーダの制御に必要なビットストリーム内の情報

3.78

スペクトル係数

解析フィルター バンクからの離散周波数領域データ出力

3.79

拡散機能

マスキング効果の周波数拡散を表す関数

3.80

ステレオ無関係

空間知覚に寄与しないステレオ音声信号の部分

3.81

詰め物(ビット)

スタッフィング (バイト)

コード化されたビットストリームの特定の位置に挿入される可能性のあるコードワード。目的のビットレートよりも低くなるストリームのビットレートを増加させることを目的として、復号化プロセスで破棄されます。

3.82

サラウンドチャンネル

フロント チャネル (L と R または L, R, および C) にオーディオ プレゼンテーション チャネルを追加して、空間認識を強化

3.83

同期語

adts_frame() の開始を識別する、オーディオ ビットストリームに埋め込まれた 12 ビット コード (6.2, 表 5 を参照)

3.84

合成フィルターバンク

サブバンド サンプルから PCM オーディオ信号を再構築するデコーダのフィルタバンク

3.85

音色成分

オーディオ信号の正弦波状成分

3.86

可変ビットレート

コード化されたビットストリームのデコード中にビットレートが時間とともに変化する操作。

3.87

可変長コーディング

短い符号語を頻繁な記号に割り当て、より長い符号語を頻度の低い記号に割り当てる符号化の可逆手順。

3.88

可変長コード

VLC

可変長エンコーダーによって割り当てられたコード ワード (可変長コーディングを参照)

3.89

可変長デコーダ

可変長符号化技術で符号化されたシンボルを取得する手順

3.90

可変長エンコーダ

シンボルに可変長符号語を割り当てる手順

参考文献

[1]Bosi M, Brandenburg K, Quackenbush S, Fielder L, Akagiri K, Fuchs H, Dietz M, Herre J, Davidson G, Oikawa Y. ISO/IEC MPEG-2 Advanced Audio Coding ", Journal of the Audio Engineering Society, Vol. 45, no. 10, pp. 789-814, 1997 年 10 月。
[2]ITU-R ドキュメント TG10-2/3-E のみ、ブロードキャスト送信および一次配信用デジタル オーディオ ビットレート削減システムの基本オーディオ品質要件、 1991 年 10 月 28 日。
[3]FJ Harris, 離散フーリエ変換の高調波解析のための Windows の使用について、Proc. of the IEEE, Vol. 66, pp. 51-83, 1975 年 1 月。

3 Terms and Definitions

For the purposes of this part of ISO/IEC 13818, the following definitions apply.

3.1

access unit

in the case of compressed audio, an audio access unit

3.2

alias

mirrored signal component resulting from sampling

3.3

analysis filterbank

filterbank in the encoder that transforms a broadband PCM audio signal into a set of spectral coefficients

3.4

ancillary data

part of the bitstream that might be used for transmission of ancillary data

3.5

audio access unit

for AAC, the smallest part of the encoded bitstream which can be decoded by itself, where decoded means"fully reconstructed sound"

Note 1 to entry: Typically, this is a segment of the encoded bitstream starting after the end of the byte containing the last bit of one ID_END id_syn_ele() through the end of the byte containing the last bit of the next ID_END id_syn_ele.

3.6

audio buffer

buffer in the system target decoder (see ISO/IEC 13818-1) for storage of compressed audio data

3.7

bark

standard unit corresponding to one critical band width of human hearing

3.8

backward compatibility

newer coding standard is backward compatible with an older coding standard if decoders designed to operate with the older coding standard are able to continue to operate by decoding all or part of a bitstream produced according to the newer coding standard

3.9

bitrate

rate at which the compressed bitstream is delivered to the input of a decoder

3.10

bitstream

stream

ordered series of bits that forms the coded representation of the data

3.11

bitstream verifier

process by which it is possible to test and verify that all the requirements specified in this part of ISO/IEC 13818 are met by the bitstream

3.12

block companding

normalizing of the digital representation of an audio signal within a certain time period

3.13

byte aligned

bit in a coded bitstream is byte-aligned if its position is a multiple of 8-bits from either the first bit in the stream for the Audio Data Interchange Format (see 6.1) or the first bit in the syncword for the Audio Data Transport Stream Format (see 6.2)

3.14

byte

sequence of 8 bits

3.15

centre channel

audio presentation channel used to stabilize the central component of the frontal stereo image

3.16

channel

sequence of data representing an audio signal intended to be reproduced at one listening position

3.17

coded audio bitstream

coded representation of an audio signal

3.18

coded representation

data element as represented in its encoded form

3.19

compression

reduction in the number of bits used to represent an item of data

3.20

constant bitrate

operation in which the bitrate is constant from start to finish of the coded bitstream

3.21

CRC

Cyclic Redundancy Check to verify the correctness of data

3.22

critical band

unit of bandwidth which represents the standard unit of bandwidth expressed in human auditory terms, corresponding to a fixed length on the human cochlea, approximately equal to 100 Hz at low frequencies and 1/3 octave at higher frequencies, above approximately 700 Hz

3.23

data element

item of data as represented before encoding and after decoding

3.24

decoded stream

decoded reconstruction of a compressed bitstream

3.25

decoder

embodiment of a decoding process

3.26

decoding (process)

process defined in this part of ISO/IEC 13818 that reads an input coded bitstream and outputs decoded audio samples

3.27

digital storage media

DSM

digital storage or transmission device or system

3.28

discrete cosine transform

DCT

either the forward discrete cosine transform or the inverse discrete cosine transform, an invertible, discrete orthogonal transformation

3.29

downmix

matrixing of n channels to obtain less than n channels

3.30

editing

process by which one or more coded bitstreams are manipulated to produce a new coded bitstream

Note 1 to entry: Conforming edited bitstreams are defined in this part of ISO/IEC 13818.

3.31

encoder

embodiment of an encoding process

3.32

encoding (process)

process, not specified in ISO/IEC 13818, that reads a stream of input audio samples and produces a valid coded bitstream as defined in this part of ISO/IEC 13818

3.33

entropy coding

variable length lossless coding of the digital representation of a signal to reduce statistical redundancy

3.34

Fast Fourier Transformation

FFT

fast algorithm for performing a discrete Fourier transform (an orthogonal transform)

3.35

filterbank

set of band-pass filters covering the entire audio frequency range

3.36

flag

variable which can take one of only the two values defined in this part of ISO/IEC 13818

3.37

forward compatibility

a newer coding standard is forward compatible with an older coding standard if decoders designed to operate with the newer coding standard are able to decode bitstreams of the older coding standard

3.38

frame

part of the audio signal that corresponds to audio PCM samples from an audio access unit

3.39

Fs

sampling frequency

3.40

Hann window

time function applied sample-by-sample to a block of audio samples before Fourier transformation

3.41

Huffman coding

specific method for entropy coding

3.42

hybrid filterbank

serial combination of subband filterbank and MDCT

3.43

IDCT

Inverse Discrete Cosine Transform

3.44

IMDCT

Inverse Modified Discrete Cosine Transform

3.45

intensity stereo

method of exploiting stereo irrelevance or redundancy in stereophonic audio programmes based on retaining at high frequencies only the energy envelope of the right and left channels

3.46

joint stereo coding

any method that exploits stereophonic irrelevance or stereophonic redundancy

3.47

joint stereo mode

mode of the audio coding algorithm using joint stereo coding

3.48

low frequency enhancement (LFE) channel

limited bandwidth channel for low frequency audio effects in a multichannel system

3.49

main audio channels

all channels represented by either single_channel_element()'s (see 8.2.1) or channel_pair_element()´s (see 8.2.1)

3.50

mapping

conversion of an audio signal from time to frequency domain by subband filtering and/or by MDCT

3.51

masking

property of the human auditory system by which an audio signal cannot be perceived in the presence of another audio signal

3.52

masking threshold

function in frequency and time below which an audio signal cannot be perceived by the human auditory system

3.53

modified discrete cosine transform

MDCT

transform which has the property of time domain aliasing cancellation

Note 1 to entry: An analytical espression for the MDCT can be found in C.3.1.2.

3.54

M/S stereo

method of removing imaging artefacts as well as exploiting stereo irrelevance or redundancy in stereophonic audio programmes based on coding the sum and difference signal instead of the left and right channels

3.55

multichannel

combination of audio channels used to create a spatial sound field

3.56

multilingual

presentation of dialogue in more than one language

3.57

non-tonal component

noise-like component of an audio signal

3.58

Number of Considered Channels

NCC

number of channels represented by the elements SCE, independently switched CCE and CPE, i.e. once the number of SCEs plus once the number of independently switched CCEs plus twice the number of CPEs, with respect to the naming conventions of the MPEG-AAC decoders and bitstreams, NCC=A+I

Note 1 to entry: This number is used to derive the required decoder input buffer size (see 8.2.3).

3.59

Nyquist sampling

sampling at or above twice the maximum bandwidth of a signal

3.60

padding

method to adjust the average length of an audio frame in time to the duration of the corresponding PCM samples, by conditionally adding a slot to the audio frame

3.61

parameter

variable within the syntax of this specification which may take one of a range of values. A variable which can take one of only two values is a flag or indicator and not a parameter

3.62

parser

functional stage of a decoder which extracts from a coded bitstream a series of bits representing coded elements

3.63

polyphase filterbank

set of equal bandwidth filters with special phase interrelationships, allowing for an efficient implementation of the filterbank

3.64

prediction error

difference between the actual value of a sample or data element and its predictor

3.65

prediction

use of a predictor to provide an estimate of the sample value or data element currently being decoded

3.66

predictor

linear combination of previously decoded sample values or data elements

3.67

presentation channel

audio channel at the output of the decoder

3.68

presentation unit

in the case of compressed audio, a decoded audio access unit

3.69

program

set of main audio channels, coupling_channel_element()'s (see 8.2.1), lfe_channel_element()'s (see 8.2.1), and associated data streams intended to be decoded and played back simultaneously

Note 1 to entry: A program may be defined by default (see 8.5.3.1 and 8.5.3.3) or specifically by a program_config_element() (see 8.5.3.2). A given single_channel_element() (see 8.2.1), channel_pair_element() (see 8.2.1), coupling_channel_element(), lfe_channel_element() or data channel may accompany one or more programs in any given bitstream.

3.70

psychoacoustic model

mathematical model of the masking behaviour of the human auditory system

3.71

random access

process of beginning to read and decode the coded bitstream at an arbitrary point

3.72

reserved

when used in the clauses defining the coded bitstream, indicates that the value may be used in the future for ISO/IEC defined extensions

3.73

sampling frequency

Fs

rate in Hertz which is used to digitize an audio signal during the sampling process

3.74

scalefactor

factor by which a set of values is scaled before quantization

3.75

scalefactor band

set of spectral coefficients which are scaled by one scalefactor

3.76

scalefactor index

numerical code for a scalefactor

3.77

side information

information in the bitstream necessary for controlling the decoder

3.78

spectral coefficients

discrete frequency domain data output from the analysis filterbank

3.79

spreading function

function that describes the frequency spread of masking effects

3.80

stereo-irrelevant

portion of a stereophonic audio signal which does not contribute to spatial perception

3.81

stuffing (bits)

stuffing (bytes)

code words that may be inserted at particular locations in the coded bitstream that are discarded in the decoding process whose purpose is to increase the bitrate of the stream which would otherwise be lower than the desired bitrate

3.82

surround channel

audio presentation channel added to the front channels (L and R or L, R, and C) to enhance the spatial perception

3.83

Syncword

a 12-bit code embedded in the audio bitstream that identifies the start of a adts_frame() (see 6.2, Table 5)

3.84

synthesis filterbank

filterbank in the decoder that reconstructs a PCM audio signal from subband samples

3.85

tonal component

sinusoid-like component of an audio signal

3.86

variable bitrate

operation in which the bitrate varies with time during the decoding of a coded bitstream

3.87

variable length coding

reversible procedure for coding that assigns shorter code words to frequent symbols and longer code words to less frequent symbols

3.88

variable length code

VLC

code word assigned by variable length encoder (see variable length coding)

3.89

variable length decoder

procedure to obtain the symbols encoded with a variable length coding technique

3.90

variable length encoder

procedure to assign variable length codewords to symbols

Bibliography

[1]M. Bosi, K. Brandenburg, S. Quackenbush, L. Fielder, K. Akagiri, H. Fuchs, M. Dietz, J. Herre, G. Davidson, Y. Oikawa,"ISO/IEC MPEG-2 Advanced Audio Coding", Journal of the Audio Engineering Society, Vol. 45, no. 10, pp. 789-814, October 1997.
[2]ITU-R Document TG10-2/3- E only, Basic Audio Quality Requirements for Digital Audio Bit-Rate Reduction Systems for Broadcast Emission and Primary Distribution, 28 October 1991.
[3]F. J. Harris, On the Use of Windows For Harmonic Analysis of the Discrete Fourier Transform, Proc. of the IEEE, Vol. 66, pp. 51- 83, January 1975.