ISO 20462-3:2012 写真—画質を推定するための精神物理学的実験方法—パート3:品質定規法 | ページ 6

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

3 用語と定義

このドキュメントでは、次の用語と定義が適用されます。

3.1

アーティファクト属性

画像で明らかな場合、ほとんどの場合、全体的な画質の低下につながる画質の属性。

例:

ノイズ、エイリアシング。

注記 1:一般的に使用される用語「欠陥」と「障害」は意味が似ています。

3.2

属性

全体的な画質の側面、次元、または構成要素

例:

シャープネスやノイズなどの画像構造のプロパティ。コントラスト、カラーバランス、相対的なカラフルさなどの色とトーンの再現特性。エイリアシング、コンタリング、圧縮欠陥などのデジタル アーティファクト。

3.3

デジタル参照刺激

DRS

ソフトコピー定規で使用されるデジタル画像のセット。シャープネスが異なり、適切に表示および表示されたときに標準品質スケール (SQS) に対して較正されます。

注記 1: DRS は、www.imaging.org の Standards Resources リンクから入手できます。

3.4

画質

画像の全体的なメリットまたは卓越性の印象。写真撮影の行為とは関係なく、描写された主題と密接に関係していない観察者によって認識されます。

注記 1:第三者の (関与していない) 観察者の観点から画質を定義する目的は、画像認識のより特異な側面から生じ、画像システム設計者の制御の及ばない属性に関連する変動性の原因を排除することです。

3.5

指示

心理物理学的評価タスクを実行するために観察者に与えられる一連の指示

3.6

ただ目立つ違い

JND

ペア比較タスクで 75:25 の割合の応答につながる刺激の違い

3.7

マグニチュード推定法

画質に比例する各テスト刺激への数値の割り当てを含む心理物理学的方法。通常、評価尺度を固定するために、数値が割り当てられた参照刺激が存在します。

注記1:マグニチュード推定実験から得られる数値スケールは、通常、比率スケールを構成すると想定されます。比率スケールは、理想的には、値の一定のパーセンテージ変化が1つのJNDに対応するスケールです。実際には、この動作からのわずかな逸脱が発生し、テスト刺激の中に未確認の参照刺激 (既知の品質を持つ) を含めることなく、評価尺度を JND の単位に変換することが複雑になります。

3.8

多変量

画質の複数の属性が異なる

3.9

観察者

心理物理学的方法で主観的評価タスクを実行する個人

3.10

一対比較法

精神物理学的方法:観察者に与えられた一連の指示に従って、同時に提示された2つの刺激のどちらがより高いまたはより低い画質またはその属性を示すかを選択することを伴う方法

注記1ペア比較法の2つの制限は次のとおりです。
  • a)通常の場合のように、考えられるすべての刺激比較が行われる場合、少数の実験的刺激レベルでも多数の評価が必要になります [ nレベルを調査する場合、 n ( n − 1)/2 対比較が必要です
  • b)刺激の差が約 1.5 JND を超える場合、比率が満場一致に近づくにつれて反応が飽和するため、刺激の差の大きさを信頼できる形で直接推定することはできません。

注記2:しかし、大きなギャップのない一連の刺激が評価される場合、より広く離れた刺激間の違いは、より小さく、確実に決定された(不飽和の)刺激の違いを合計することによって間接的に推定される場合があります。一対の比較データを間隔スケール (JND に直線的に関連するスケール) に変換する標準的な方法は、刺激の違いを推測するために統計的に最適化された手順を実行しますが、飽和応答が分析に含まれている場合、信頼できない結果が生じる可能性があります。

3.11

優遇属性

画像において常に明らかであり、観察者と画像の内容の両方に応じて、どの程度が好ましいかは意見の問題である画質の属性。

例:

コントラストや相対的なカラフルさなどの色と色調の再現特性。

注記1選好属性に関連する知覚品質は観察者と画像内容の両方に依存するため、選好属性のバリエーションを含む研究では、代表的な刺激セットと観察者グループの選択に特別な注意が必要です。

注記 2: 「わずかに目立つ違い」の「目立つ」という用語は、優先属性に適用される場合、言語的に厳密には正しくありませんが、ISO 20462 のこの部分では便宜上保持されています。たとえば、コントラストのみが異なるペアのより高いコントラストの刺激は、すべての観察者によって容易に識別される可能性がありますが、2 つの画像のどちらが全体的な画質が高いかについてのコンセンサスが不足している可能性があります。それにもかかわらず、品質の一対比較からの応答が 75:25 の比率であった場合、より頻繁に選択された画像は、品質が 1 つ高い JND であると言えます。 JND は、ペア比較の予測結果または測定結果に関連付けられた測定単位と見なすのが最適です。

3.12

心理物理学的方法

画質またはその属性を主観的に評価するための実験的手法であり、そこから JND 単位の刺激の違いを推定することができます。

cf. マグニチュード推定法 , 一対比較法 , 品質定規法 , トリプレット比較 法

3.13

品質は目に見える違いです

品質のJND

多変量刺激ペアが全体的な画質の観点から評価されるペア比較タスクで、応答の 75:25 の割合につながる刺激の違いに対応する、品質変動の重要性または重要性の尺度

注記 1:詳細については、ISO 20462-1:2005 の属性 JND (3.3) および品質 JND (3.14) を参照してください。

3.14

品質定規法

既知の数のJNDによって異なる一連の順序付けられた一変量参照刺激に対するテスト刺激の品質または属性評価を含む心理物理学的方法

3.15

参照刺激

与えられた評価が JND 単位に変換されるような方法で、テスト刺激の知覚的評価を固定または調整する目的で観察者に提供される画像

注記1複数形は参照刺激である。

3.16

シーン

画像の内容または主題、またはさまざまな実験的処理を通じて複数の刺激が生成される可能性のある開始画像

注記 1:通常、心理物理実験では同じシーンを描写する刺激が比較されます。これは、対象となるのは治療の効果であり、画像内容の違いが誤った効果を引き起こす可能性があるためです。シーンの内容が一致しない場合は、シーンの効果が平均化されるように、多数のシーンを使用する必要があります。

3.17

標準品質尺度

SQS

次のプロパティを持つ品質の固定数値スケール:
  • a)数値スケールは、物理的基準に対して固定されています。
  • b)スケール値の 1 単位の増加は、品質の 1 JND の改善に対応します。他の
  • c)ゼロの値は、画像の主題の性質を識別するのが困難なほど情報量が少ない画像に対応します。

注記1: SQS 1 (一次SQS)は、標準参照刺激(SRS)に追跡可能な評価を通じて得られた値を示します。 SQS 2 (二次 SQS) は、デジタル参照刺激 (DRS) または平均シーン関係 (7.2 を参照) に追跡可能な評価を通じて得られた値を示します。

3.18

標準参照刺激

SRS

ハードコピー品質定規で使用される反射プリントのセット。シャープネスが異なり、標準品質スケール (SQS) に対して校正されています。

注記 1: SRS は、www.imaging.org の Standards Resources リンクから入手できます。

3.19

刺激

知覚的評価を固定する目的(参照刺激)または主観的評価(テスト刺激)の目的で、観察者に提示または提供される画像

注記1複数形は刺激です。

3.20

抑制

1 つの属性が画質を著しく低下させる程度に存在し、それによって他の属性が全体的な品質に及ぼす影響を、支配的な属性が存在しない場合に与えたであろう影響と比較して減少させる知覚的効果。

注記 1つの属性の変化に基づいて指定された数の JND によって分離された参照刺激を生成するには、他の属性が変化した属性の影響を大幅に抑制しないようにする必要があります。

3.21

テスト刺激

主観的評価のために観察者に提示される画像

注記1複数形はテスト刺激である。

3.22

処理

精神物理学的実験で調査されるテスト刺激 (シーンの内容を除く) 間の変動の制御または特性化されたソース

例:

さまざまな画像処理アルゴリズム、キャプチャまたは表示デバイスのプロパティの違い、画像キャプチャ条件 (カメラの露出など) の変更など。

注記 1:ハードウェアまたはソフトウェアの変更によって異なる処理が実現される場合もあれば、そのような効果の数値シミュレーションである場合もあります。通常、一連の処理が複数のシーンに適用され、それぞれが一連のテスト刺激を生成します。次に、信号対雑音比を改善し、系統的バイアスの可能性を減らすために、シーンと観察者にわたって結果を平均することによって、治療の効果を決定することができます。

3.23

トリプレット比較

心理物理学的方法:観察者に与えられた一連の指示に従って、画質またはその属性に関して 3 つのテスト刺激を同時にスケーリングすることを含む

注記 1トリプレット比較法については、ISO 20462-2 でより詳細に説明されています。

3.24

一変量

画質の単一の属性のみが異なる

参考文献

[1]ISO 20462-1:2005, 写真 — 画質を推定するための精神物理学的実験方法 — 1: 精神物理学的要素の概要
[2]ISO 20462-2, 写真 — 画質を推定するための心理物理学的実験方法 — 2: トリプレット比較法
[3]宮﨑和人、金房惠一、卯本英、竹村和、卜部英、平井和、四川伊和、畑田卓。および画質評価 (II) — トリプレット比較、 Proc. SPIE , 4300 , 2001, pp. 309-313
[4]竹村、K.、宮崎、K.、U rabe 、H.、 Toyoda 、N.、I shikawa, K.、および Hatada, T . イメージ品質を推定するための新しい心理物理学的実験方法の開発、 Proc. SPIE, 4421, 2001 、 906
[5]Keelan 、BW Handbook of Image Quality: Characterization and Prediction 、Marcel Dekker, Inc.、ニューヨーク、ISBN 0-8247-0770-2, 2002 年、Chpt. 7と8
[6]Keelan 、BW Handbook of Image Quality: Characterization and Prediction 、Marcel Dekker, Inc.、ニューヨーク、ISBN 0-8247-0770-2, 2002 年、Chpt. 5
[7]Keelan 、BW Handbook of Image Quality: Characterization and Prediction 、Marcel Dekker, Inc.、ニューヨーク、ISBN 0-8247-0770-2, 2002 年、Fig. 14.2, 14.3, 4.3, 4.4, および 21.
[8]Keelan 、BW Handbook of Image Quality: Characterization and Prediction 、Marcel Dekker, Inc.、ニューヨーク、ISBN 0-8247-0770-2, 2002 年、Chpt. 4
[9]Keelan 、BW Handbook of Image Quality: Characterization and Prediction 、Marcel Dekker, Inc.、ニューヨーク、ISBN 0-8247-0770-2, 2002 年、Chpt. 11
[10]Jin E Keelan B ChenJPhillips J およびChen Y Softcopy品質定規法: 実装と検証Proc. SPIE 7242, 2009, 724206-1-724206-14

3 Terms and definitions

For the purposes of this document, the following terms and definitions apply.

3.1

artefactual attribute

attribute of image quality that, when evident in an image, nearly always leads to a loss of overall image quality

EXAMPLE:

Noise, aliasing.

Note 1 to entry: The commonly used terms"defect" and"impairment" are similar in meaning.

3.2

attribute

aspect, dimension, or component of overall image quality

EXAMPLE:

Image structure properties such as sharpness and noise; colour and tone reproduction properties such as contrast, colour balance, and relative colourfulness; digital artefacts such as aliasing, contouring, and compression defects.

3.3

digital reference stimuli

DRS

set of digital images used in the softcopy ruler, which vary in sharpness and are calibrated against the standard quality scale (SQS) when suitably displayed and viewed

Note 1 to entry: The DRS will be available at the Standards Resources link at www.imaging.org.

3.4

image quality

impression of the overall merit or excellence of an image, as perceived by an observer neither associated with the act of photography nor closely involved with the subject matter depicted

Note 1 to entry: The purpose of defining image quality in terms of third-party (uninvolved) observers is to eliminate sources of variability that arise from more idiosyncratic aspects of image perception and pertain to attributes outside the control of imaging system designers.

3.5

instructions

set of directions given to the observer for performing the psychophysical evaluation task

3.6

just noticeable difference

JND

stimulus difference that leads to a 75:25 proportion of responses in a paired comparison task

3.7

magnitude estimation method

psychophysical method involving the assignment of a numerical value to each test stimulus that is proportional to image quality; typically, a reference stimulus with an assigned numerical value is present to anchor the rating scale

Note 1 to entry: The numerical scale resulting from a magnitude estimation experiment is usually assumed to constitute a ratio scale which, ideally, is a scale in which a constant percentage change in value corresponds with one JND. In practice, modest deviations from this behaviour occur, complicating the transformation of the rating scale into units of JNDs without inclusion of unidentified reference stimuli (having known quality) among the test stimuli.

3.8

multivariate

varying in multiple attributes of image quality

3.9

observer

individual performing the subjective evaluation task in a psychophysical method

3.10

paired comparison method

psychophysical method involving the choice of which of two simultaneously presented stimuli exhibits greater or lesser image quality or an attribute thereof, in accordance with a set of instructions given to the observer

Note 1 to entry: Two limitations of the paired comparison method are as follows.
  • a) If all possible stimulus comparisons are done, as is usually the case, a large number of assessments are required for even modest numbers of experimental stimulus levels [if n levels are to be studied, n ( n − 1)/2 paired comparisons are needed].
  • b) If a stimulus difference exceeds approximately 1,5 JNDs, the magnitude of the stimulus difference cannot be directly estimated reliably because the response saturates as the proportions approach unanimity.

Note 2 to entry: However, if a series of stimuli having no large gaps are assessed, the differences between more widely separated stimuli may be deduced indirectly by summing smaller, reliably determined (unsaturated) stimulus differences. The standard methods for transformation of paired comparison data to an interval scale (a scale linearly related to JNDs) perform statistically optimized procedures for inferring the stimulus differences, but they may yield unreliable results when saturated responses are included in the analysis.

3.11

preferential attribute

attribute of image quality that is invariably evident in an image, and for which the preferred degree is a matter of opinion, depending upon both the observer and the image content

EXAMPLE:

Colour and tone reproduction properties such as contrast and relative colourfulness.

Note 1 to entry: Because the perceived quality associated with a preferential attribute is dependent upon both the observer and image content, in studies involving variations of preferential attributes, particular care is needed in the selection of representative sets of stimuli and groups of observers.

Note 2 to entry: The term"noticeable" in"just noticeable difference" is not linguistically strictly correct when applied to a preferential attribute, but is nonetheless retained in this part of ISO 20462 for convenience. For example, the higher contrast stimulus of a pair differing only in contrast might be readily identified by all observers, whereas there might be a lack of consensus regarding which of the two images was higher in overall image quality. Nonetheless, if the responses from the paired comparison for quality were in the proportion of 75:25, the image chosen more frequently would be said to be one JND higher in quality. The JND is best regarded as a measurement unit tied to the predicted or measured outcome of a paired comparison.

3.12

psychophysical method

experimental technique for subjective evaluation of image quality or attributes thereof, from which stimulus differences in units of JNDs may be estimated

3.13

quality just noticeable difference

quality JND

measure of the significance or importance of quality variations, corresponding to a stimulus difference that leads to a 75:25 proportion of responses in a paired comparison task in which multivariate stimuli pairs are assessed in terms of overall image quality

Note 1 to entry: See attribute JND (3.3) and quality JND (3.14) in ISO 20462-1:2005 for greater detail.

3.14

quality ruler method

psychophysical method that involves quality or attribute assessment of a test stimulus against a series of ordered, univariate reference stimuli that differ by known numbers of JNDs

3.15

reference stimulus

image provided to the observer for the purpose of anchoring or calibrating the perceptual assessments of test stimuli in such a manner that the given ratings may be converted to JND units

Note 1 to entry: The plural is reference stimuli.

3.16

scene

content or subject matter of an image, or a starting image from which multiple stimuli may be produced through different experimental treatments

Note 1 to entry: Typically, stimuli depicting the same scene are compared in a psychophysical experiment because it is the effect of the treatment that is of interest, and differences in image content could cause spurious effects. In cases where scene content is not matched, a number of scenes should be used so that scene effects may be expected to average out.

3.17

standard quality scale

SQS

fixed numerical scale of quality having the following properties:
  • a) the numerical scale is anchored against physical standards;
  • b) a one unit increase in scale value corresponds to an improvement of one JND of quality; and
  • c) a value of zero corresponds to an image having so little information content that the nature of the subject of the image is difficult to identify.

Note 1 to entry: SQS1 (primary SQS) denotes values obtained through assessments traceable to the standard reference stimuli (SRS). SQS2 (secondary SQS) denotes values obtained through assessments traceable to the digital reference stimuli (DRS) or the average scene relationship (see 7.2).

3.18

standard reference stimuli

SRS

set of reflection prints used in the hardcopy quality ruler, which vary in sharpness and are calibrated against the standard quality scale (SQS)

Note 1 to entry: The SRS will be available at the Standards Resources link at www.imaging.org.

3.19

stimulus

image presented or provided to the observer either for the purpose of anchoring a perceptual assessment (a reference stimulus) or for the purpose of subjective evaluation (a test stimulus)

Note 1 to entry: The plural is stimuli.

3.20

suppression

perceptual effect in which one attribute is present in a degree that seriously degrades image quality and thereby reduces the impact that other attributes have on overall quality, compared to the impact they would have had in the absence of the dominant attribute

Note 1 to entry: To generate reference stimuli that are separated by a specified number of JNDs based on variations in one attribute, it will be necessary to ensure that other attributes do not significantly suppress the impact of the varied attribute.

3.21

test stimulus

image presented to the observer for subjective evaluation

Note 1 to entry: The plural is test stimuli.

3.22

treatment

controlled or characterized source of the variations between test stimuli (excluding scene content) that are to be investigated in a psychophysical experiment

EXAMPLE:

Different image processing algorithms, variations in capture or display device properties, changes in image capture conditions (e.g. camera exposure), etc.

Note 1 to entry: Different treatments may be achieved through hardware or software changes, or may be numerical simulations of such effects. Typically, a series of treatments is applied to multiple scenes, each generating a series of test stimuli. The effect of the treatment may then be determined by averaging the results over scene and observer to improve signal-to-noise and reduce the likelihood of systematic bias.

3.23

triplet comparison

psychophysical method that involves the simultaneous scaling of three test stimuli with respect to image quality or an attribute thereof, in accordance with a set of instructions given to the observer

Note 1 to entry: The triplet comparison method is described in more detail in ISO 20462-2.

3.24

univariate

varying only in a single attribute of image quality

Bibliography

[1]ISO 20462-1:2005, Photography — Psychophysical experimental methods for estimating image quality — 1: Overview of psychophysical elements
[2]ISO 20462-2, Photography — Psychophysical experimental methods for estimating image quality — 2: Triplet comparison method
[3]Miyazaki, K., Kanafusa, K., Umemoto, H., Takemura, K., Urabe, H., Hirai, K., Ishikawa, K. and Hatada, T. A standard portrait image and image quality assessment (II) — Triplet comparison, Proc. SPIE, 4300 , 2001, pp. 309−313
[4]Takemura, K., Miyazaki, K., Urabe, H., Toyoda, N., Ishikawa, K. and Hatada, T. Developing a new psychophysical experimental method to estimate image quality, Proc. SPIE, 4421 , 2001, p. 906
[5]Keelan, B.W. Handbook of Image Quality: Characterization and Prediction, Marcel Dekker, Inc., New York, ISBN 0-8247-0770-2, 2002, Chpt. 7 and 8
[6]Keelan, B.W. Handbook of Image Quality: Characterization and Prediction, Marcel Dekker, Inc., New York, ISBN 0-8247-0770-2, 2002, Chpt. 5
[7]Keelan, B.W. Handbook of Image Quality: Characterization and Prediction, Marcel Dekker, Inc., New York, ISBN 0-8247-0770-2, 2002, Figs. 14.2, 14.3, 4.3, 4.4, and 21.5.
[8]Keelan, B.W. Handbook of Image Quality: Characterization and Prediction, Marcel Dekker, Inc., New York, ISBN 0-8247-0770-2, 2002, Chpt. 4
[9]Keelan, B.W. Handbook of Image Quality: Characterization and Prediction, Marcel Dekker, Inc., New York, ISBN 0-8247-0770-2, 2002, Chpt. 11
[10]Jin, E., Keelan, B., Chen, J., Phillips, J. and Chen, Y. Softcopy quality ruler method: Implementation and validation, Proc. SPIE 7242, 2009, 724206-1-724206-14