ISO 1831:1980 光学式文字認識の印刷仕様 | ページ 2

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

序文

ISO (国際標準化機構) は、各国の標準化機関 (ISO メンバー団体) の世界的な連合です。国際規格の策定作業は、ISO 技術委員会を通じて実施されます。技術委員会が設置された主題に関心のあるすべての会員団体は、その委員会に代表される権利を有します。 ISOと連携して、政府および非政府の国際機関もこの作業に参加しています。

技術委員会によって採択された国際規格の草案は、ISO 理事会によって国際規格として承認される前に、承認のためにメンバー団体に回覧されます。

国際規格 ISO 1831 は、技術委員会 ISO/TC 97, コンピュータおよび情報処理によって開発され、1979 年 1 月にメンバー団体に回覧されました。

以下の国の加盟団体によって承認されています。

オーストラリアアイルランドルーマニア
ベルギーイタリア南アフリカ共和国
チェコスロバキア日本スペイン
フィンランドメキシコスウェーデン
フランスオランダスイス
ドイツ、フランスポーランドソビエト連邦

次の国のメンバー団体は、技術的な理由で文書の不承認を表明しました。

カナダ
イギリス
アメリカ

この国際規格は、ISO 勧告 R 1831-1971 を取り消し、置き換えます。ISO 勧告 R 1831-1971 の技術改訂版です。

0 はじめに

この国際規格の目的は、光学式文字認識 (OCR) システム、特に文書交換で使用される紙と印刷の業界標準の基礎を確立し、そのようなシステムの実装と使用を支援することです。

それは、関連するパラメータの識別と測定を提供し、その仕様を確立し、それらの使用に関するガイダンスを提供します。

0.1 国際規格の解釈

印刷システムは、印刷機、用紙、およびインク付きリボン (印刷プロセスで必要な場合のみ) で構成される単一のユニットとして定義されます。 OCR アプリケーション用の印刷物を生成する印刷システムは、OCR 印刷システムと呼ばれます。

この国際規格の値は、印刷システム、フォント (OCRA, OCR-B)、および特定のアプリケーションに関係なく、OCR 印刷物に適用されるものとします。印刷された画像の寸法および光学特性は、3 つの品質範囲について示されています。

パラメータごとに許容限界が指定されています。これらの制限は少なくとも達成される必要がありますが、すべてのパラメーターは制限内に十分に保たれることが期待されます。これらのパラメータの一部が指定された制限から逸脱する統計的性質の変動の影響を受ける場合、これらの逸脱の数と大きさは、OCR 印刷システム コンポーネントをより正確に選択する、より頻繁に印刷機のメンテナンス、印刷速度の低下、リボンの寿命の短縮など。

光学式文字認識システムのパフォーマンスが統計的性質の変動の影響を受け、許容範囲内で文字の拒否または置換が発生した場合、これらの偏差の数と大きさは、次のような特別な予防措置を使用して減らすことができます。認識システムなどのより頻繁なメンテナンス。

0.2 国際規格の使用

この規格で指定されている測定方法とパラメータの値は、OCR アプリケーションでの使用を目的としています。

印刷システムと認識システムの両方に責任がある統計的性質の偏差のために、これらの値を継続的かつ完全に満たすことができないため、文字の拒否や置換が発生する可能性があります。許可される拒否および代替の数は、特定の OCR アプリケーションに依存し、ユーザー、印刷システムのサプライヤ、および認識システムのサプライヤによって統計的に合意されるものとします。

印刷システムの保証では、印刷システムの製造元には、印刷システムと使用する消耗品 (用紙やリボンなど) の保守料金を指定する権利が与えられます。

認識システムの保証において、認識システムのサプライヤーは、環境条件 (温度、湿度、照度、機械的振動および電磁ノイズの最大量など) を指定し、メンテナンスのレベルを確立する権利を与えられます。読者。

属性の検査による統計的サンプリング計画は、これらの計画が品質管理で通常使用されるものと一貫している場合、これらの保証が守られているかどうかを確認するために使用できます。

サンプリング計画が合意されると、サンプル サイズ (すなわち、検査される文字または文書の数) が計画によって確立されます。

印刷システムをチェックできるようにするために、測定される印刷物のパラメータと測定方法がこの国際規格に記載されています。

認識システムがチェックされるときは、この国際規格で指定された仕様を満たす印刷物のみを使用するか、合意により、現在の資料の代表的なサンプルを使用することができます。後者の場合、不合格品は、この国際規格への準拠に従って評価する必要があります。

0.3 附属書

附属書は、この規格の不可欠な部分ではありませんが、追加情報を提供します。

1 適用範囲と適用分野

この国際規格には、OCR 用紙と印刷物に関する基本的な定義、測定要件、仕様、および推奨事項が含まれています。

OCR メディアの印刷ドキュメントの 3 つの主要なパラメーターについて説明します。これらは :

  • -使用する紙の光学特性;
  • - OCR 文字を形成するインク パターンの光学的および寸法的特性。
  • -用紙上の OCR 文字の位置に関する基本要件。

OCR に関連するこれらの各領域の主な要因が特定されています。これらの項目の定義が与えられ、測定の根拠が確立されます。

すべての OCR マテリアルに適用される基本仕様が課せられ、OCR システムの実装に関する推奨事項が作成されます。

2 参考文献

  • ISO 216, 筆記用紙および特定のクラスの印刷物 - トリミング サイズ - A および B シリーズ。
  • ISO 1073/1, 光学認識用の英数字文字セット - Part 1: 文字セット OCR-A - 印刷イメージの形状と寸法。
  • ISO 1073/2, 光学認識用の英数字文字セット - Part 2: 文字セット OCR-B - 印刷イメージの形状と寸法。
  • ISO 2469, 紙、板紙、パルプ - 拡散反射率の測定。
  • ISO 2471, 紙および板紙 - 不透明度の測定 (裏紙) - 拡散反射法。

Foreword

ISO (the International Organization for Standardization) is a worldwide federation of national standards institutes (ISO member bodies). The work of developing International Standards is carried out through ISO technical committees. Every member body interested in a subject for which a technical committee has been set up has the right to be represented on that committee. International organizations, governmental and non-governmental, in liaison with ISO, also take part in the work.

Draft International Standards adopted by the technical committees are circulated to the member bodies for approval before their acceptance as International Standards by the ISO Council.

International Standard ISO 1831 was developed by Technical Committee ISO/TC 97, Computers and information processing, and was circulated to the member bodies in January 1979.

It has been approved by the member bodies of the following countries:

AustraliaIrelandRomania
BelgiumItalySouth Africa, Rep. of
CzechoslovakiaJapanSpain
FinlandMexicoSweden
FranceNetherlandsSwitzerland
Germany, F. R.PolandUSSR

The member bodies of the following countries expressed disapproval of the document on technical grounds:

Canada
United Kingdom
USA

This International Standard cancels and replaces ISO Recommendation R 1831-1971, of which it constitutes a technical revision.

0 Introduction

The purpose of this International Standard is to establish the basis for industry standards for paper and printing to be used in Optical Character Recognition (OCR) systems, particularly for document interchange, and to aid in the implementation and use of such systems.

It provides for the identification and measurement of, and establishes specifications for, the relevant parameters and gives guidance for their use.

0.1 Interpretation of the International Standard

A printing system is defined as a single unit comprising a printing machine, paper and inked ribbon (the latter only if required by the printing process). A printing system which produces printed material for OCR applications is called an OCR printing system.

The values in this International Standard shall apply to OCR printed material regardless of the printing system, font (OCRA, OCR-B) and the specific application. The dimensional and optical characteristics of the printed image are given for three quality ranges.

Tolerance limits are specified for each parameter. These limits at least shall be achieved, but all parameters are expected to be kept well within them. If some of these parameters subject to variations of a statistical nature deviate from the specified limits, then the number and magnitude of these deviations can be reduced by using special precautions, such as a more accurate choice of the OCR printing system components, more frequent maintenance of the printing machine, a reduction of the printing speed, a shortening of the ribbon life, etc.

If the performance of an optical character recognition system is subject to variations of a statistical nature and if rejections or substitutions of characters within the tolerance limits occur then, again, the number and magnitude of these deviations can be reduced by using special precautions, such as a more frequent maintenance of the recognition system, etc.

0.2 Use of the International Standard

The measurement methods and the values of the parameters given in this standard are intended for use in OCR applications.

As a continuous, complete fulfilment of these values cannot be achieved because of the deviations of a statistical nature to which both printing and recognition systems are liable, some rejection and substitution of characters may occur. The number of rejections and substitutions which are allowed depends on the specific OCR application and shall be agreed upon, in statistical terms, by the user, the supplier(s) of the printing system and the supplier(s) of the recognition system.

In the guarantee of printing systems, the manufacturer of the printing system is given the right to specify the maintenance rate for the printing system and the supplies to be used (for example paper and ribbon).

In the guarantee of the recognition system, the supplier of the recognition system is given the right to specify the environmental conditions (temperature, humidity, illumination, maximum amount of mechanical vibrations and electromagnetic noise, etc.) and to establish the level of maintenance for the reader.

Statistical sampling plans by inspection of attributes can be used to check whether these guarantees are being observed, provided that these plans are coherent with those normally used in quality control.

Once a sampling plan has been agreed upon, the sample size (i.e. the number of characters or documents to be examined) is established by the plan.

To allow the printing system to be checked, the parameters of the printed material to be measured and the measurement methods are given in this International Standard.

When the recognition system is checked, only printed material meeting the specifications given in this International Standard shall be used, or - by agreement - representative samples of current material may be used. In the latter case the rejects must be evaluated according to their compliance with this International Standard.

0.3 Annexes

The annexes are not an integral part of this International Standard but give additional information.

1 Scope and field of application

This International Standard contains the basic definitions, measurement requirements, specifications and recommendations for OCR paper and print.

Three major parameters of a printed document for OCR media are covered. These are:

  • - the optical properties of the paper to be used;
  • - the optical and dimensional properties of the ink patterns forming OCR characters;
  • - the basic requirements related to the position of OCR characters on the paper.

The major factors of each of these areas pertinent to OCR are identified. Definitions of these items are given and bases for measurements are established.

Basic specifications applicable to all OCR materials are imposed and recommendations for the implementation of an OCR system are made.

2 References

  • ISO 216, Writing paper and certain classes of printed matter - Trimmed sizes - A and B series.
  • ISO 1073/1, Alphanumeric character sets for optical recognition - Part 1: Character set OCR-A - Shapes and dimensions of the printed image.
  • ISO 1073/2, Alphanumeric character sets for optical recognition - Part 2: Character set OCR-B - Shapes and dimensions of the printed image.
  • ISO 2469, Paper, board and pulps - Measurement of diffuse reflectance factor.
  • ISO 2471, Paper and board - Determination of opacity (paper backing) - Diffuse reflectance method.