ISO/IEC 30116:2016 情報技術—自動識別およびデータキャプチャ技術—光学式文字認識(OCR)品質テスト | ページ 2

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

序文

ISO (国際標準化機構) と IEC (国際電気標準会議) は、世界標準化のための専門システムを形成しています。 ISO または IEC のメンバーである国家機関は、技術活動の特定の分野を扱うために、それぞれの組織によって設立された技術委員会を通じて、国際規格の開発に参加しています。 ISO と IEC の技術委員会は、相互に関心のある分野で協力しています。 ISO および IEC と連携して、政府および非政府の他の国際機関もこの作業に参加しています。情報技術の分野では、ISO と IEC が合同技術委員会 ISO/IEC JTC 1 を設立しました。

この文書の開発に使用された手順と、今後の維持のために意図された手順は、ISO/IEC 指令で説明されています。 1. 特に、さまざまなタイプの文書に必要なさまざまな承認基準に注意する必要があります。この文書は、ISO/IEC 指令の編集規則に従って作成されました。 2 ( www.iso.org/directives を参照)

このドキュメントの要素の一部が特許権の対象となる可能性があることに注意してください。 ISO および IEC は、そのような特許権の一部またはすべてを特定する責任を負わないものとします。ドキュメントの開発中に特定された特許権の詳細は、序文および/または受信した特許宣言の ISO リストに記載されます ( www.iso.org/patents を参照)

このドキュメントで使用されている商号は、ユーザーの便宜のために提供された情報であり、保証を構成するものではありません。

適合性評価に関連する ISO 固有の用語と表現の意味に関する説明、および技術的貿易障壁 (TBT) における世界貿易機関 (WTO) の原則への ISO の準拠に関する情報については、次の URL を参照してください: www.iso .org/iso/foreword.html .

この文書を担当する委員会は、ISO/JTC 1, 情報技術、小委員会 SC 31, 自動識別およびデータ取得技術です。

序章

ISO/IEC 7501 (すべての部分)/ICAO Doc 9303 (すべての部分) に準拠した MRTD (機械読み取り可能な旅行書類) および ISO/IEC 18013 (すべての部分) に準拠した運転免許証などの ID ドキュメントの検査については、信頼できる人間工学に基づいた書類検査技術が不可欠です。 RFID の相互運用性を考慮すると、MRTD とリーダー デバイスの相互運用性評価とテストのメカニズムを導入することで、強力な改善が達成されました。同様の光学読み取り基準により、OCR の信頼性が向上します。ドキュメントの MRZ (機械読み取り可能ゾーン) の OCR は、BAC (基本アクセス制御) および/または SAC (補助アクセス制御) で保護されたパスポートにアクセスするために不可欠であるため、これは特に重要です。

このように、信頼性の高い OCR により、自動化された国境管理システムや他の多くのアプリケーションのパフォーマンスがより予測可能になります。さらに、ドキュメント リーダー製品の評価をはるかに簡単に行うことができます。この標準化プロジェクトは、OCR ドキュメントの品質を評価するためのテスト方法を定義します。さらに、該当する OCR 標準への準拠を保証する要件を定義します。このプロジェクトは、バーコードの読み取りや、場合によっては OCR の他のテスト方法など、他のドメインからの経験を適用します。 MRTD と運転免許証との間で仕様作業に矛盾が生じる可能性がある場合は、MRTD の定義を満たすことが優先されます。

1 スコープ

このドキュメント

  • OCR-B 文字列の特定の属性の測定方法を指定します。
  • これらの測定値を評価し、文字列品質の全体的な評価を導出する方法を定義し、
  • OCR-B のリファレンス デコード アルゴリズムを定義し、
  • 最適な等級からの逸脱の考えられる原因に関する情報を提供し、ユーザーが適切な是正措置を講じるのを支援します。

このドキュメントは、ISO 1073-2 で定義されている OCR-B に適用されますが、その方法論は他の OCR フォントに部分的または完全に適用できます。

2 参考文献

このドキュメントには規範的な参照はありません。

3 用語と定義

このドキュメントでは、次の用語と定義が適用されます。

ISO および IEC は、次のアドレスで標準化に使用する用語データベースを維持しています。

3.1

二値化画像

参照グレースケール画像の ピクセル (3.5) 値にグローバルしきい値を適用して作成されたバイナリ (黒/白) 画像

3.2

ドキュメント参照エッジ

MRZ のある表面の下に黒い背景を置き、物理的なストップに対してドキュメントをスライドさせることによって位置が決定される MRZ のある表面の物理的 (つまり、機械的) 端。

3.3

検査エリア

クワイエットゾーンを含めてテストされる シンボル全体(3.11) を含む長方形の領域

3.4

文字輪郭制限

文字の理想的な印刷イメージの輪郭

注記 1:これは、ISO 1831 で利用される定性的評価であり、この文書では SWT に置き換えられます。

3.5

ピクセル

感光性アレイ内の個々の感光性要素

注記 1:感光性アレイの例は、CCD (電荷結合素子) または CMOS (相補型金属酸化膜半導体) デバイスです。

3.6

生画像

感光性アレイの各 ピクセル(3.5) の離散反射率値から導出された、2次元画像全体のxおよびy座標の反射率値のマトリックス

3.7

参照グレースケール画像

生の画像 (3.6) を合成円形開口で畳み込み

3.8

スキャングレード

OCR シンボルの 1 回のスキャンの評価の結果。参照グレースケールおよび 2 値化された画像 (3.1) の測定パラメータに対して達成された最低グレードを取得することによって導出されます。

3.9

ストローク幅

OCR 文字を構成する線の方向に垂直な公称寸法。

3.10

ストローク幅テンプレート

附属書 A で定義された文字の中心線座標によって作成された線に中心が続く円によって定義される文字の内側と外側の境界

3.11

シンボル

クワイエット ゾーンと ドキュメント参照エッジ (3.2) を含む、機械可読エンティティ全体を構成する OCR 文字のグループ (ICAO 9303 で指定されているマシン可読ゾーン (MRZ)、サイズ ID-1, ID-2, および ID-3)

注記 1: ISO/IEC 7501 (すべての部分) (ICAO 9303) では、文書サイズは TD1, TD2 および TD2 として定義されていますが、同じサイズが ISO/IEC 7810 では ID-1, ID-1 および ID として定義されています。 -3.このドキュメントでは、ID-1, ID-2, および ID-3 という用語を使用します。

3.12

X公差

公称 ストローク幅 (3.9) が 0.35 mm のサイズ I の場合は 0.08 mm

注記 1:公称ストローク幅 0.35 mm のサイズ I の 0.08 mm は、もともと ISO 1831:1980 の表 2 で定義されていました。

3.13

Y 公差

公称 ストローク幅 (3.9) が 0.35 mm のサイズ I の場合は 0.15 mm

注記 1:公称ストローク幅 0.35 mm のサイズ I の 0.15 mm は、もともと ISO 1831:1980 の表 2 で定義されていました。

参考文献

[1]ISO 1073-2:1976, 光学認識用の英数字文字セット — 2: 文字セット OCR-B — 印刷イメージの形状と寸法
[2]ISO 1831:1980, 光学式文字認識の印刷仕様
[3]ISO/IEC 750, ID カード — 機械可読旅行書類
[4]ISO/IEC 7810, ID カード — 物理的特性
[5]ISO/IEC 1801, 情報技術 — 個人識別 — ISO 準拠の運転免許証
[6]ISO/IEC 19762, 情報技術 - 自動識別およびデータ取得 (AIDC) 技術 - 調和語彙
[7]ICAO ドキュメント 9303, 機械可読旅行書類

Foreword

ISO (the International Organization for Standardization) and IEC (the International Electrotechnical Commission) form the specialized system for worldwide standardization. National bodies that are members of ISO or IEC participate in the development of International Standards through technical committees established by the respective organization to deal with particular fields of technical activity. ISO and IEC technical committees collaborate in fields of mutual interest. Other international organizations, governmental and non-governmental, in liaison with ISO and IEC, also take part in the work. In the field of information technology, ISO and IEC have established a joint technical committee, ISO/IEC JTC 1.

The procedures used to develop this document and those intended for its further maintenance are described in the ISO/IEC Directives, 1. In particular the different approval criteria needed for the different types of document should be noted. This document was drafted in accordance with the editorial rules of the ISO/IEC Directives, 2 (see www.iso.org/directives ).

Attention is drawn to the possibility that some of the elements of this document may be the subject of patent rights. ISO and IEC shall not be held responsible for identifying any or all such patent rights. Details of any patent rights identified during the development of the document will be in the Introduction and/or on the ISO list of patent declarations received (see www.iso.org/patents ).

Any trade name used in this document is information given for the convenience of users and does not constitute an endorsement.

For an explanation on the meaning of ISO specific terms and expressions related to conformity assessment, as well as information about ISO's adherence to the World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT) see the following URL: www.iso.org/iso/foreword.html .

The committee responsible for this document is ISO/JTC 1, Information technology, Subcommittee SC 31, Automatic identification and data capture techniques.

Introduction

For the inspection of ID documents, i.e. MRTDs (Machine Readable Travel Documents) according to ISO/IEC 7501 (all parts)/ICAO Doc 9303 (all parts) and driving licences according to ISO/IEC 18013 (all parts), a reliable and ergonomic document inspection technology is essential. Considering RFID interoperability, strong improvement has been reached introducing mechanisms for interoperability evaluation and testing of MRTDs and reader devices. Similar standards for optical reading would improve the reliability of OCR. This is especially important because OCR of the document’s MRZ (Machine Readable Zone) is essential for accessing BAC (Basic Access Control) and/or SAC (Supplementary Access Control) protected passports.

Thus, reliable OCR makes the performance of automated border control systems, as well as of many other applications, more predictable. Furthermore, the evaluation of document reader products can be done much easier. This standardization project defines test methods to evaluate OCR document quality. Furthermore, it defines requirements ensuring the compliance to the applicable OCR standards. The project applies experiences from other domains such as bar code reading and possibly other test methods for OCR. Where conflicts in the specification work between MRTDs and driving licenses may arise, satisfying the definitions for MRTDs is given preference.

1 Scope

This document

  • specifies the methodology for the measurement of specific attributes of OCR-B character strings,
  • defines a method for evaluating these measurements and deriving an overall assessment of character string quality,
  • defines a reference decode algorithm for OCR-B, and
  • gives information on possible causes of deviation from optimum grades to assist users in taking appropriate corrective action.

This document applies to OCR-B as defined in ISO 1073-2, but its methodology can be applied partially or wholly to other OCR fonts.

2 Normative references

There are no normative references in this document.

3 Terms and definitions

For the purposes of this document, the following terms and definitions apply.

ISO and IEC maintain terminological databases for use in standardization at the following addresses:

3.1

binarized image

binary (black/white) image created by applying the global threshold to the pixel (3.5) values in the reference grey-scale image

3.2

document reference edge

physical (i.e. mechanical) end of the surface with the MRZ whose position is determined by putting a black background under the surface with the MRZ and sliding the document up against a physical stop

3.3

inspection area

rectangular area which contains the entire symbol (3.11) to be tested inclusive of its quiet zones

3.4

character outline limits

outlines of an ideal printed image of a character

Note 1 to entry: This is a qualitative evaluation utilized in ISO 1831 that is replaced in this document with SWT.

3.5

pixel

individual light-sensitive element in a light-sensitive array

Note 1 to entry: Examples of light-sensitive array are CCD (charge coupled device) or CMOS (complementary metal oxide semiconductor) device.

3.6

raw image

matrix of the reflectance values in x and y coordinates across a two-dimensional image, derived from the discrete reflectance values of each pixel (3.5) of the light-sensitive array

3.7

reference grey-scale image

raw image (3.6) convolved with a synthesized circular aperture

3.8

scan grade

result of the assessment of a single scan of an OCR symbol, derived by taking the lowest grade achieved for any measured parameter of the reference grey-scale and binarized images (3.1)

3.9

stroke width

nominal dimension perpendicular to the direction of the line making up an OCR character

3.10

stroke width template

inner and outer character boundaries defined by circles whose centres follow the line created by the character centreline coordinates defined in Annex A

3.11

symbol

group of OCR characters comprising the entire machine-readable entity (e.g. Machine Readable Zone (MRZ) as specified in ICAO 9303, sizes ID-1, ID-2 and ID-3) including quiet zones and the document reference edge (3.2)

Note 1 to entry: Document sizes are defined in ISO/IEC 7501 (all parts) (ICAO 9303) as TD1, TD2 and TD2, whereas the same sizes are defined in ISO/IEC 7810 as ID-1, ID-1 and ID-3. In this document, we use the terms ID-1, ID-2 and ID-3.

3.12

X-tolerance

0,08 mm for Size I with a nominal stroke width (3.9) of 0,35 mm

Note 1 to entry: 0,08 mm for Size I with a nominal stroke width of 0,35 mm was originally defined in ISO 1831:1980, Table 2.

3.13

Y-tolerance

0,15 mm for Size I with a nominal stroke width (3.9) of 0,35 mm

Note 1 to entry: 0,15 mm for Size I with a nominal stroke width of 0,35 mm was originally defined in ISO 1831:1980, Table 2.

Bibliography

[1]ISO 1073-2:1976, Alphanumeric character sets for optical recognition — 2: Character set OCR-B — Shapes and dimensions of the printed image
[2]ISO 1831:1980, Printing specifications for optical character recognition
[3]ISO/IEC 7501 (all parts), Identification cards — Machine readable travel documents
[4]ISO/IEC 7810, Identification cards — Physical characteristics
[5]ISO/IEC 18013 (all parts), Information technology — Personal identification — ISO-compliant driving licence
[6]ISO/IEC 19762, Information technology — Automatic identification and data capture (AIDC) techniques — Harmonized vocabulary
[7]ICAO Document 9303, Machine Readable Travel Documents