この規格 プレビューページの目次
※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。
3 用語と定義
このドキュメントでは、次の用語と定義が適用されます。
ISO と IEC は、次のアドレスで標準化に使用する用語データベースを維持しています。
3.1
従属アノテーション
音声またはビデオの記録を直接参照するのではなく、別の注釈 (通常は正書法または音声表記) を参照する注釈。
3.2
マイルストーン要素
境界点を示すために使用される空の XML 要素
3.3
正字表記
それぞれの言語の正書法に基づく話し言葉の表現またはモデリング
3.4
パラ言語機能
声質、ピッチ、音量、イントネーションなど、個々の音を超えた話し言葉の特徴
3.5
発音表記
それぞれの言語の音響システムに基づく話し言葉の表現またはモデリング
3.6
話し言葉
人の発声系によって作り出される口頭言語
3.7
転写者
文字起こしをする人
3.8
転記
文字記号による話し言葉の表現またはモデリング
3.9
転写システム
理論的に確立された原則と規則のセットで、どの音声言語現象が書き起こされ、どのように書き起こされるかを詳述
参考文献
| [1] | Barras C, Geoffrois E, Wu Z, Liberman M Transcriber: 音声コーパス生成を支援するツールの開発と使用。スピーチコミュニケーション。 2001, 33 pp. 5–22 |
| [2] | Berners-Lee T, Masinter L, McCahill M, 1994) URL (Uniform Resource Locator) IETF RFC#173 http://www.ietf.org/rfc/rfc1738.txt |
| [3] | Bird S, Liberman M, 言語注釈の正式なフレームワーク。スピーチコミュニケーション。 2001, 33 pp. 23–60 |
| [4] | Boersma P, Weenink D, 1996)。 PRAAT, コンピュータで音声学を行うためのシステム、バージョン 3.アムステルダム大学音声科学研究所、レポート 132, 182 ページ |
| [5] | Broeder D, Wittenburg P, 2002)。メタデータによる言語資源の管理。 LREC 2002 議事録 |
| [6] | Broeder D, van Uytvanck D, メタデータ形式。 In: The Oxford Handbook of Corpus Phonology (Durand J., Gut U., Kristoffersen G., eds.), 2014, pp. 150–165 |
| [7] | DuBois J, Schuetze-Coburn S, Cumming S, Paolino D 談話転写の概要。 In: Talking Data: Transcription and Coding in Discourse Research , (Edwards J., Lampert M., eds.), Erlbaum, Hillsdale, NJ, 1993, pp. 45–89 |
| [8] | 解放された N, Borenstein N, 1996 年)。 Multipurpose Internet Mail Extensions (MIME) Part 2: メディアの種類。 IETF RFC#204 http://www.ietf.org/rfc/rfc2046.txt |
| [9] | Hedeland H.、Wörner K.、2012)既存のメタデータ スキーマから CMDI プロファイルを作成する経験と問題。 LREC ワークショップの議事録「メタデータを使用した LR の記述: LR の文書化における柔軟性と相互運用性に向けて」。エルラ |
| [10] | Kipp M.、ANVIL: ビデオ注釈研究ツール。 In: The Oxford Handbook of Corpus Phonology , (Durand J., Gut U., Kristoffersen G., eds.), 2014 |
| [11] | MacWhinney B.、 CHILDES プロジェクト: トークを分析するためのツール。 Erlbaum, Mahwah, NJ, 2000., http://childes.psy.cmu.edu/manuals/chat.pdf |
| [12] | Parisse C.、Morgenstern A.、2010)マルチソフトウェア統合プラットフォームと言語のマルチメディア トランスクリプトのサポート。 LREC 2010: マルチモーダル コーパスに関するワークショップ: キャプチャ、コーディング、およびマルチモダリティの分析の進歩、2010 年 5 月、ラ バレット、マルタ。 LREC 2010 議事録: マルチモーダル コーパスに関するワークショップ: キャプチャ、コーディング、およびマルチモダリティの分析の進歩、pp. 106-110 |
| [13] | Rehbein J, Schmidt T, Meyer B, Watske F, Herkenrath A, 2004) HIAT 後のコンピューター支援転写のマニュアル。中: 多言語主義に関する研究、シリーズ B (56) |
| [14] | Romary L.、Witt A.、音韻コーパスのデータ形式。 In: The Oxford Handbook of Corpus Phonology , (Durand J., Gut U., Kristoffersen G., eds.), 2014, pp. 166–192 |
| [15] | シュミット T.、コンピューター支援転写 - テキスト技術的手段を使用した話し言葉のモデリングと視覚化。フランクフルトM.ピーター・ラング、2005 |
| [16] | Schmidt T, Duncan S, Ehmer O, Hoyt J, Kipp M, Magnusson M et al. マルチモーダル注釈の交換フォーマット。 In: Multimodal Corpora, Lecture Notes in Computer Science (Kipp M., Martin J.-C., Paggio P., Heylen D., eds.), Springer, 2009, pp. 207–221 |
| [17] | Schmidt T, Elenius K, Trilsbeek P, 2010)マルチメディア コーパス (メディアのエンコードと注釈) CLARIN WG 5.7 に提出されたドラフト。 CLARIN成果物D5.C-3「Interoperability and Standards」へのインプットとして [ http://www.clarin.eu/system/files/clarin-deliverable-D5C3_v1_5-finaldraft.pdf ] も参照: http://www1.uni -hamburg.de/exmaralda/files/CLARIN_Standards.pdf |
| [18] | Schmidt T.、Schuette W.、2010) FOLKER: 自然なマルチパーティのやり取りを効率的に転写するための注釈ツール。中: Calzolari, N.、Choukri, K. ら。 (eds.): Proceedings of the Seventh Conference on International Language Resources and Evaluatio, バレッタ、マルタ: European Language Resources Association (ELRA) |
| [19] | シュミット T.、2011)音声言語の書き起こしを標準化する TEI ベースのアプローチ。 Journal of the Text Encoding Initiative [オンライン], 第 1 号 | 2011 年 6 月、URL: [ http://jtei.revues.org/142 ]; DOI: [要素のレンダリングが定義されていません: pub-id ] 10.4000/jtei.142 |
| [20] | Schmidt T.、Wörner K.、EXMARALD中: The Oxford Handbook of Corpus Phonology (Durand J., Gut U., Kristoffersen G., eds.), Oxford University Press, 2014, pp. 402–419 |
| [21] | Selting M, Auer P, Barth-Weingarten D, Bergmann J, Bergmann P, Birkner K et al.、2009)会話分析転写システム , pp. 353-402 |
| [22] | Sloetjes H.、2014) ELAN: マルチメディア注釈アプリケーション。 In: The Oxford Handbook of Corpus Phonology , (Durand J., Gut U., Kristoffersen G., eds.), pp. 305–320 |
| [23] | TEIコンソーシアム(2015年編)。 TEI P5: 電子テキストのエンコードと交換に関するガイドライン。 [バージョン 2.8.0 [最終更新日 2015 年 4 月 6 日 TEI コンソーシアム。 http://www.tei-c.org/Guidelines/P5/ |
| [24] | 音声合成マークアップ言語 (SSML) バージョン 1.1, W3C 勧告、2010 年 9 月 7 日 |
| [25] | EMMA: Extensible MultiModal Annotation マークアップ言語、W3C 勧告 2009 年 2 月 10 日 |
| [26] | ISO 63, 言語の名前を表すためのコード |
| [27] | ISO 5218, 情報技術 — 人間の性別を表すためのコード |
| [28] | ISO 8601, データ要素と交換フォーマット — 情報交換 — 日付と時刻の表現 |
| [29] | ISO 24611, 言語リソース管理 — 形態構文注釈フレームワーク (MAF) |
| [30] | ISO/IEC 10646, 情報技術 — Universal Coded Character Set (UCS) |
3 Terms and definitions
For the purposes of this document, the following terms and definitions apply.
ISO and IEC maintain terminological databases for use in standardization at the following addresses:
3.1
dependent annotation
annotation which does not refer directly to an audio or video recording, but to another annotation, typically an orthographic or phonetic transcription
3.2
milestone element
empty XML element used to indicate a boundary point
3.3
orthographic transcription
representation or modelling of spoken language based on the orthography of the respective language
3.4
paralinguistic feature
feature of spoken language beyond the individual sound(s), such as voice quality, pitch, volume, intonation
3.5
phonetic transcription
representation or modelling of spoken language based on the sound system of the respective language
3.6
spoken language
oral language produced by a person’s vocal system
3.7
transcriber
person who carries out the transcription
3.8
transcription
representation or modelling of spoken language by means of written symbols
3.9
transcription system
theoretically founded set of principles and rules detailing what spoken language phenomena are to be transcribed, and how they are to be transcribed
Bibliography
| [1] | Barras C., Geoffrois E., Wu Z., Liberman M., Transcriber: Development and use of a tool for assisting speech corpora production. Speech Communication. 2001, 33 pp. 5–22 |
| [2] | Berners-Lee T., Masinter L., McCahill M., 1994). Uniform Resource Locators (URL). IETF RFC #1738. http://www.ietf.org/rfc/rfc1738.txt |
| [3] | Bird S., Liberman M., A formal framework for linguistic annotation. Speech Communication. 2001, 33 pp. 23–60 |
| [4] | Boersma P., Weenink D., 1996). PRAAT, a system for doing phonetics by computer, version 3.4. Institute of Phonetic Sciences of the University of Amsterdam, Report 132. 182 pages |
| [5] | Broeder D., Wittenburg P., 2002). Management of language resources using metadata. Proceedings of LREC 2002 |
| [6] | Broeder D., van Uytvanck D., Metadata formats. In: The Oxford Handbook of Corpus Phonology, (Durand J., Gut U., Kristoffersen G., eds.), 2014, pp. 150–165 |
| [7] | DuBois J., Schuetze-Coburn S., Cumming S., Paolino D., Outline of discourse transcription. In: Talking Data: Transcription and Coding in Discourse Research, (Edwards J., Lampert M., eds.), Erlbaum, Hillsdale, NJ, 1993, pp. 45–89 |
| [8] | Freed N., Borenstein N., 1996). Multipurpose Internet Mail Extensions (MIME) Part Two: Media Types. IETF RFC #2046. http://www.ietf.org/rfc/rfc2046.txt |
| [9] | Hedeland H., Wörner K., 2012). Experiences and problems creating a CMDI profile from an existing metadata schema. In Proceedings of LREC-Workshop"Describing LRs with Metadata: Towards Flexibility and Interoperability in the Documentation of LR". ELRA |
| [10] | Kipp M., ANVIL: The video annotation research tool. In: The Oxford Handbook of Corpus Phonology, (Durand J., Gut U., Kristoffersen G., eds.), 2014 |
| [11] | MacWhinney B., The CHILDES Project: Tools for Analyzing Talk. Erlbaum, Mahwah, NJ, 2000., http://childes.psy.cmu.edu/manuals/chat.pdf |
| [12] | Parisse C., Morgenstern A., 2010). A multi-software integration platform and support for multimedia transcripts of language. LREC 2010: Workshop on Multimodal Corpora: Advances in Capturing, Coding and Analyzing Multimodality, May 2010, La Valette, Malta. LREC 2010 Proceedings: Workshop on Multimodal Corpora: Advances in Capturing, Coding and Analyzing Multimodality, pp. 106–110 |
| [13] | Rehbein J., Schmidt T., Meyer B., Watzke F., Herkenrath A., 2004). Handbuch für das computergestützte Transkribieren nach HIAT. In: Arbeiten zur Mehrsprachigkeit, Series B (56) |
| [14] | Romary L., Witt A., Data formats for phonological corpora. In: The Oxford Handbook of Corpus Phonology, (Durand J., Gut U., Kristoffersen G., eds.), 2014, pp. 166–192 |
| [15] | Schmidt T., Computergestützte Transkription - Modellierung und Visualisierung gesprochener Sprache mit texttechnologischen Mitteln. Frankfurt a. M. Peter Lang, 2005 |
| [16] | Schmidt T., Duncan S., Ehmer O., Hoyt J., Kipp M., Magnusson M. et al., An exchange format for multimodal annotations. In: Multimodal Corpora, Lecture Notes in Computer Science (Kipp M., Martin J.-C., Paggio P., Heylen D., eds.), Springer, 2009, pp. 207–221 |
| [17] | Schmidt T., Elenius K., Trilsbeek P., 2010). Multimedia Corpora (Media encoding and annotation). Draft submitted to CLARIN WG 5.7. as input to CLARIN deliverable D5.C-3"Interoperability and Standards" [ http://www.clarin.eu/system/files/clarin-deliverable-D5C3_v1_5-finaldraft.pdf ] See also: http://www1.uni-hamburg.de/exmaralda/files/CLARIN_Standards.pdf |
| [18] | Schmidt T., Schütte W., 2010). FOLKER: An annotation tool for efficient transcription of natural, multi-party interaction. In: Calzolari, N., Choukri, K. et al. (eds.): Proceedings of the Seventh Conference on International Language Resources and Evaluation (LREC'10), Valletta, Malta: European Language Resources Association (ELRA) |
| [19] | Schmidt T., 2011). A TEI-based Approach to Standardising Spoken Language Transcription. Journal of the Text Encoding Initiative [Online], Issue 1 | June 2011, URL: [ http://jtei.revues.org/142 ]; DOI: [no rendering defined for element: pub-id ] 10.4000/jtei.142 |
| [20] | Schmidt T., Wörner K., EXMARaLDA. In: The Oxford Handbook of Corpus Phonology, (Durand J., Gut U., Kristoffersen G., eds.), Oxford University Press, 2014, pp. 402–419 |
| [21] | Selting M.,, Auer P.,, Barth-Weingarten D.,, Bergmann J.,, Bergmann P.,, Birkner K. et al., 2009). Gesprächsanalytisches Transkriptionssystem 2 (GAT 2). In: Gesprächsforschung - Online-Zeitschrift zur verbalen Interaktion 10 (2009), pp. 353–402 |
| [22] | Sloetjes H., 2014). ELAN: Multimedia annotation application. In: The Oxford Handbook of Corpus Phonology, (Durand J., Gut U., Kristoffersen G., eds.), pp. 305–320 |
| [23] | TEI Consortium, (2015, eds.). TEI P5: Guidelines for Electronic Text Encoding and Interchange. [Version 2.8.0]. [Last updated 6 April 2015]. TEI Consortium. http://www.tei-c.org/Guidelines/P5/ |
| [24] | Speech Synthesis Markup Language (SSML) Version 1.1, W3C Recommendation 7 September 2010 |
| [25] | EMMA: Extensible MultiModal Annotation markup language, W3C Recommendation 10 February 2009 |
| [26] | ISO 639 (all parts), Codes for the representation of names of languages |
| [27] | ISO 5218, Information technology — Codes for the representation of human sexes |
| [28] | ISO 8601, Data elements and interchange formats — Information interchange — Representation of dates and times |
| [29] | ISO 24611, Language resource management — Morpho-syntactic annotation framework (MAF) |
| [30] | ISO/IEC 10646, Information technology — Universal Coded Character Set (UCS) |