情報処理学会 試行標準 IPSJ-TS 0009:2004

ディクテーションに用いる基本記号に対応する読み

Sounds-like Spellings of Commonly Used Symbols in Japanese Dictation Systems



序文

この学会試行標準(IPSJ-TS)は,学会試行標準/WG4小委員会(音声言語インターフェース)において2003年度までに行われた音声アプリケーションのための音声コマンドに関する調査研究をもとに,特に重要と判断される技術情報をまとめ,学会試行標準(IPSJ-TS)として公表するものである.

1. 適用範囲

この学会試行標準(IPSJ-TS)は,日本語ディクテーションシステムにおいて文入力中に基本記号を使用する際に用いる読みを規定する.

2. 定義

2.1 (ディクテーションに用いる) 基本記号に対応する読み (Sounds-like Spellings of Commonly Used Symbols in Japanese Dictation Systems)

ディクテーションシステムにおいて 文入力中に基本記号をどのように読むかを規定するもの. 読みの記述には「音声認識のための読み表記」 (情報処理学会 試行標準 IPSJ-TS 0004:2003)における 「読み表記」 (Sounds-like Symbols) を使用する.

3. 基本記号に対応する読み

主にディクテーションシステムによって日本語の文を入力する場合に用いられる基本記号に対応する読みを,表1 に示す.

この試行標準に適合するディクテーションシステムは,表1に示す「基本記号」に対して,表1の「読み」を認識するように設計されなければならないが,その他の「読み」を認識してもよい.

この試行標準に適合するディクテーションシステムが表1の読みを正しく認識した場合に,入力される基本記号が,複数の文字コードに対応している場合(例えば,2バイト文字と1バイト文字)は,アプリケーションに依存して区別が行われるものとし,本試行標準では特に規定しない.

備考1
「基本記号に対応する読み」では, エンドユーザが利用できることを念頭において, なじみやすい読みを用いている.
基本記号の範囲としては, 一般的なパーソナルコンピュータの日本語キーボードによって 入力可能なもののうち, 英数字,漢字,かたかな,ひらがななどの文字を 除いたものを目安として選択している.
基本記号には,「改行」などの操作の名称は含まれない.
読みは,特定の文字コードなどに対してではなく,基本記号の視覚的形状に対して定義する.
1つの視覚的形状に対して原則として1つの読みを定義する. ただし,アプリケーションに依存する例外として以下を設ける.
特に句読点などに関しては,1つの読みからどの視覚的形状の基本記号が入力されるかは,アプリケーションに依存する.
読みは次の基準に従って選択する.

ただし,外来語を語源とする読みに関しては,その語源となる単語に置き換えて広く用いられている単語を選択し,さらにその単語に対して広く用いられている読みを選択した.

表1 ディクテーションに用いる基本記号に対応する読み

基本記号読み読みのバリエーション
こんま
ぴりおど どっと
ころん
せみころん
くえっしょんまーく
びっくりまーく
はっと
から
~ ちるだ
_ あんだーばー
まいなす はいふん
すらっしゅ
ばっくすらっしゅ
たてぼう
ぷらす
いこーる
しょうなり
だいなり
えん
どる
ぱーせんと
しゃーぷ
あんぱさんど あんど
あすたりすく
あっとまーく
(空白) すぺーす
' くおーてーしょん
" だぶるくおーてーしょん
かっこ
かっことじる
だいかっこ
だいかっことじる
かぎかっこ
かぎかっことじる
てん
まる
なかてん

4. 参考文献

(なし)