ISO/IEC 14756:1999 情報技術  —  コンピュータベースのソフトウェアシステムのパフォーマンスの測定と評価 | ページ 4

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

1 スコープ

この国際規格は、コンピュータベースのソフトウェア システム (CBSS) のユーザー指向のパフォーマンスを測定および評価する方法を定義します。 CBSS は、そのユーザー (たとえば、さまざまな端末のユーザー) から見えるデータ処理システム、またはデータ処理センターの運用ユーザーやビジネス ユーザーから見えるデータ処理システムです。

CBSS には、ユーザーが必要とするデータ処理機能、または CBSS の時間動作に影響を与える可能性のあるデータ処理機能を実現するために必要なハードウェアとそのすべてのソフトウェア (システム ソフトウェアおよびアプリケーション ソフトウェア) が含まれます。

この国際規格は、時間に制約のあるあらゆるシステムまたはシステム部品のテストに適用されます。また、ネットワークはシステムの一部である場合もあれば、テストの主要な対象である場合もあります。この国際規格で定義されている方法は、古典的なバッチ システムやターミナル ホスト システムなどの特殊なケースに限定されません。たとえば、クライアント サーバー システム、または「タスク」の定義をより広範に理解するリアルタイム システムも含まれます。ただし、大規模な環境のテストに必要な費用によって、テストの実行可能性が制限される可能性があります。

この国際規格は、ユーザー指向のパフォーマンス用語の主要な数値を指定し、これらのパフォーマンス値を測定および評価する方法を指定します。指定されたパフォーマンス値は、ユーザーの注文 (タスク) の実行速度を表す値、つまり次の 3 倍の値です。

  • 実行時間、
  • スループット、
  • 適時性。

ユーザーの命令 (以降タスクと呼ばれます) は、単純な内部構造を持つ場合もあれば、複雑な内部構造を持つ場合もあります。タスクはジョブ、トランザクション、プロセス、またはより複雑な構造である可能性がありますが、評価者のニーズに応じて開始と終了が定義されています。パフォーマンスを評価する場合、この国際標準を使用して、他の個別の応答時間に加えて、ビジネス トランザクションの完了時間を参照して時間の動作を測定することができます。

評価は、ユーザーの要件に関して、または 2 つ以上の測定されたシステム (タイプまたはバージョン) を比較することによって行われます。

次のような内部値を測定するための提案は意図的に行われていません。

  • 使用率の値、
  • 平均指導率、
  • パスの長さ、
  • キャッシュヒット率、
  • 待ち時間、
  • サービスタイム、

内部値の定義はテスト対象システムのハードウェアとソフトウェアのアーキテクチャに依存するため、与えられています。これとは対照的に、この国際標準で定義されているユーザー指向のパフォーマンス値はアーキテクチャに依存しません。内部パフォーマンス値の定義は、ユーザー指向のパフォーマンス値の定義とは独立して行うことができます。これらは、ユーザー指向のパフォーマンス値に加えて使用および測定できます。また、ユーザー指向の価値を生み出す効率に関する用語の定義も行うことができます。さらに、この国際規格は、データ処理システムで安定した再現可能な動作状態を確立する方法についての指針を提供します。この再現可能な状態は、上記の内部値などの他のパフォーマンス値を測定するために使用できます。

この国際規格は以下に焦点を当てています。

  • アプリケーションソフトウェア。
  • システムソフトウェア。
  • ターンキー システム (つまり、アプリケーション ソフトウェア、システム ソフトウェア、およびそれが設計されたハードウェアで構成されるシステム)
  • 一般的なデータ処理システム。

この国際規格は、データ処理システムとのユーザー対話のエミュレーション (技術システム、いわゆるリモート ターミナル エミュレーター (RTE) による) の要件を指定します。これは、ユーザー指向のパフォーマンス値を正確に測定し評価するためのガイドラインです。これは、ユーザーの決定論的およびランダムな動作を伴う CBSS に必要な精度と再現性を備えたこれらの値を推定するためのガイドラインを提供します。また、RTE を実装するため、またはこの国際標準に従って機能するかどうかを証明するためのガイドラインも提供します。

この国際規格は、精度と再現性が必要な場合に、ランダムなユーザー動作による CBSS のパフォーマンスを測定および評価するためのガイドラインを提供します。測定手順の準備方法と実行方法が詳細に規定されています。測定値の分析の説明とともに、性能値と評価値の計算式を示します。

この国際規格は、以下に関する指針も提供します。

  • 以下を使用してユーザー指向のベンチマーク テストを設計する方法:
    • *トランザクション指向のワークロード、
    • *バッチ指向のワークロード、
    • *またはトランザクションとバッチの混合ワークロード。

以下を指定します。

  • このようなワークロードをどのように説明するか、
  • 測定手順の実行方法、
  • 測定結果をどのように評価するか。

この国際規格は以下の人々にとって興味深いものです。

  • 評価者、
  • 開発者、開発者
  • 購入者 (データ処理システムのユーザーを含む)、
  • システムインテグレーター

CBSSの。

注 1この国際規格の適用分野は、以下の側面を含むように拡張される場合があります。この標準の仕様を満たし、十分に一般的な構造を有するワークロードは、標準ワークロードとして使用できます。これらは、特定の分野で使用されるデータ処理システムのパフォーマンスを測定および評価するために使用される場合があります。たとえば、ワードプロセッシングの標準ワークロードは、同じハードウェア システム上で実行される異なるソフトウェア製品または同じ製品の異なるバージョンの時間効率を比較するために使用できます。また、そのような標準ワークロードは、常に同じアプリケーション ソフトウェア バージョンを適用する場合にも使用できます。システム ソフトウェアの効率を比較するには、同じハードウェアを使用します。システムベンダーが通常販売しているように、ハードウェアとシステムソフトウェアで構成される異なるシステムに同じアプリケーションソフトウェアとワークロードを適用する場合、使用されるアプリケーションとワークロードに関してデータ処理システムの効率を比較できます。

1 Scope

This International Standard defines how user oriented performance of computer-based software systems (CBSS) may be measured and rated. A CBSS is a data processing system as it is seen by its users, e.g. by users at various terminals, or as it is seen by operational users and business users at the data processing center.

A CBSS includes hardware and all its software (system software and application software) which is needed to realize the data processing functions required by the users or what may influence to the CBSS's time behaviour.

This International Standard is applicable for tests of all time constrained systems or system parts. Also a network may be part of a system or may be the main subject of a test. The method defined in this International Standard is not limited to special cases like classic batch or terminal-host systems, e.g. also included are client server systems or, with a broader comprehension of the definition of 'task', real time systems. But the practicability of tests may be limited by the expenditure required to test large environments.

This International Standard specifies the key figures of user oriented performance terms and specifies a method of measuring and rating these performance values. The specified performance values are those which describe the execution speed of user orders (tasks), namely the triple of:

  • execution time,
  • throughput,
  • timeliness.

The user orders, subsequently called tasks, may be of simple or complex internal structure. A task may be a job, transaction, process or a more complex structure, but with a defined start and end depending on the needs of the evaluator. When evaluating the performance it is possible to use this International Standard for measuring the time behaviour with reference to business transaction completion times in addition to other individual response times.

The rating is done with respect to users requirements or by comparing two or more measured systems (types or versions).

Intentionally no proposals for measuring internal values, such as:

  • utilisation values,
  • mean instruction rates,
  • path lengths,
  • cache hit rates,
  • queuing times,
  • service times,

are given, because the definition of internal values depends on the architecture of the hardware and the software of the system under test. Contrary to this the user oriented performance values which are defined in this International Standard are independent of architecture. The definition of internal performance values can be done independently from the definition of user oriented performance values. They may be used and can be measured in addition to the user oriented performance values. Also the definition of terms for the efficiency with which the user oriented values are produced can be done freely. In addition this International Standard gives guidance on how to establish at a data processing system a stable and reproducible state of operation. This reproducible state may be used to measure other performance values such as the above mentioned internal values.

This International Standard focuses on:

  • application software;
  • system software;
  • turn-key systems (i.e. systems consisting of an application software, the system software and the hardware for which it was designed);
  • general data processing systems.

This International Standard specifies the requirements for an emulation (by a technical system - the so-called remote terminal emulator (RTE) - of user interactions with a data processing system. It is the guideline for precisely measuring and rating the user oriented performance values. It provides the guideline for estimating these values with the required accuracy and repeatability of CBSSs with deterministic as well as random behaviour of users. It is also a guidance for implementing a RTE or proving whether it works according to this International Standard.

This International Standard provides the guideline to measure and rate the performance of CBSS with random user behaviour when the accuracy and repeatability is required. It specifies in detail how to prepare and carry out the measurement procedure. Along with a description of the analysis of the measured values, the formulas for computing the performance value and the rating value, are provided.

This International Standard also gives guidance on:

  • how to design a user oriented benchmark test using a:
    • * transaction oriented workload,
    • * batch oriented workload,
    • * or transaction and batch mixed workload.

It specifies:

  • how to describe such a workload,
  • how to perform the measurement procedure,
  • how to rate the measured results.

This International Standard is of interest to:

  • evaluators,
  • developers,
  • buyers (including users of a data processing system),
  • system integrators

of CBSSs.

NOTE 1 The field of application of this International Standard may be extended to include the following aspects. Workloads fulfilling the specifications of this standard and having a sufficiently general structure may be used as standard workloads. They may be used to measure and rate performance of data processing systems used in specific fields. E.g. a standard workload for word-processing may be used to compare the time efficiency of different software products or different versions of the same product running on the same hardware system. Such a standard workload may also be used if always applying the same application software version and the same hardware to compare the efficiency of the system software. When applying the same application software and workload to different systems, consisting of hardware and system software, as normally sold by system vendors, the efficiency of the data processing systems may be compared with respect to the application and workload used.