情報処理学会 試行標準 IPSJ-TS 0002:2004

文字図形識別情報 解説



1. 公表の趣旨

情報処理学会情報規格調査会では2001年度から学会試行標準制度を制定し, いくつかの学会試行標準を作成している。この学会試行標準の文字図形識別情報は, その中で最も早くから作成されたものであり, 学会試行標準として今後の役割が大いに期待されている。

学会試行標準は, わが国から標準を海外に発信するための準備段階のもの, 又は標準に関係するシステム開発, 研究開発に資するものを学会として認定し, 広く公開して意見を求めるものである。

この学会試行標準に関係するものとして, ISO/IEC JTC1/SC2の符号化文字に関する国際規格, 及びSC34のフォントに関する国際規格があり, コンピュータの普及に伴って世界中の文字関連の標準化が進められている。文字鏡を中心とするこの学会試行標準は, それらの国際規格の基礎を固めると同時に, 文字に関する国際的な研究のために必須の標準としての役割を担うことが期待されている。したがって, 情報処理学会情報規格調査会のウェブページで公開されている文字図形集合が, 多くの関係者によって参照されて前述の役割を担うと同時に, この学会試行標準に関する忌憚のない意見が寄せられて, 改良され発展することを願っている。


2. 背景

今昔文字鏡は, 1985年秋より開始した人工知能の研究開発を端緒として, 以来十数年の研鑚を経て1997年3月にその初版が出版された。2000年10月には, 漢字を取り扱うための環境が整備されていないシステムでの利用と, 符号化文字以外の文字の利用とを目的とした文字データベース"文字鏡Web"(http://www.mojikyo.com), 及び"文字鏡フォントサーバ"が, アプリケーションプロバイダサービスとして開始された。2001年10月には, 漢字辞書の基本といわれる説文解字の篆書一万字のアウトラインフォント化を成功させ, 同時に世界最初の西夏文字6000字のアウトラインフォント作成及びその公開を実現した。

学会試行標準の一部である文字図形は, アウトラインフォントの形で文字鏡研究会から配布されている。文字鏡研究会(http://www.mojikyo.org)は, 1996年4月に谷田貝常夫及び谷本玲大ほか有志数名が発起人となり, 財団法人斯文会理事長の石川忠久(2001年12月現在 二松学舎大学学長)を会長に迎えて設立された。文字鏡研究会は, 今昔文字鏡の理念を支える団体である。

その理念は, 次に示す文字鏡研究会の四つの目的に現れている。

a) 漢字及び漢字と関わりのあるアジア諸国の文字を人類共通の貴重な文化的財産と認識し, それらの文字を長い将来まで保持可能にする。

b) 過去, 現在及び将来にわたる多くのアジア諸国の文字を収集し, 今昔文字鏡に収録して, 検索を容易なものとし, 世界中の人が利用できる体制を作る。

c) 漢字文化圏諸国の古今にわたる膨大な漢字を体系的に整理し, 共通の方式で処理するための方途を探る。

d) これらの活動の成果を世に問うため, 印刷・通信媒体, その他による発表を行い, 収録文字の検討, 会報の発行, 研究会・講演会などの活動を行う。

これらの目的を達成するために, 様々な活動が行われている。例えば, 今昔文字鏡が商標であり製品として流通するものであるにもかかわらず, 非営利であることを条件に文字鏡フォントの自由利用が認められ, 2098年10月まで配布権を所持する文字鏡研究会がこれを保証している。これらのフォントは, TrueType及びその他の多種の様式に変換されて世界中に配布され, USAのスタンフォード大学がミラーサイトを設置して北米全域の配布事業を担当している。

文字鏡研究会の配布フォントの文字種は, 漢字だけではなく, 字喃, 甲骨文字, 梵字, 西夏文字など多様であり, 国内外研究者の支持及び助力によってさらに拡大している。字喃については, 2000年10月に漢喃研究院の鄭克孟, ベトナム言語学会会長の阮光紅ら数名を東京に招き, ベトナム公使らの臨席のもとで, 字喃のアウトラインフォントをベトナムに贈呈した。

2001年12月に, 文字鏡研究会を支える役員全員及び新たな各界諸氏の参加によって, 特定非営利活動法人文字鏡ネット(代表 谷田貝常夫)が設立された。文字鏡ネット(http://www.mojikyo.net)は, 文字データベースの製作などに代表される情報電子化業務についての直接的作業及びそれに必要な人材の教育・養成を行い, さらに文化団体, コンピュータ技術開発会社, 電子出版事業を目指す出版各社などの情報電子化をさまざまな形で担う団体組織に対して有効な助言及び助力を与える活動を主眼とする。


3. 審議中の主要検討課題

3.1 用語の定義に関する補足

この学会試行標準で対象としている"文字図形"について, 日常言語における語彙の用いられ方と規格などにおける語彙の用いられ方との相違について解説する。

公的な規格, 規定においては, ある語彙を日常言語における用法に制限又は拡張を加えて用いる場合は, 厳密な定義を与える。例えばJIS X 0213は, 情報交換用文字集合で用いられる文字(character), 字体, 字形及び図形文字(graphic character)について, 次の定義を与えている。

文字(character)
データの構成, 制御又は表現に用いる構成単位の集合の要素。
字体
図形文字の図形表現としての形状についての抽象的概念。
字形
字体を, 手書き, 印字, 画面表示などによって実際に図形として表現したもの。
図形文字(graphic character)
制御機能以外で, 通常, 手書き・印字・表示の可視的表現をもち, 一つ以上のビット組合わせからなる符号化表現をもつ文字。

この学会試行標準が対象とする"文字図形"の"文字"は, 符号化文字集合における"データの構成, 制御又は表現に用いる構成単位の集合の要素"を意味することを意図したものではなく, あくまでも日常言語における"文字"の図形表現を意味する。したがってこの学会試行標準では, "文字"という用語に定義を与えていない。

"文字図形"は, 符号化文字集合の規格においては, 包摂規準(JIS X 0208, JIS X 0213の場合), Unification Rule(ISO/IEC 10646の場合)などの規範を用いて, 統合化される複数の字体, 字形, デザイン差として同一視される図形表現を弁別する場合も多々あるという点で, 具象性をもつ図形表現である。

しかし, 表現された図形要素の太さなどは捨象されているので, 必ずしも可視的な図形表現そのものではない。つまり, "文字図形"とは, 日常的な意味で用いられる"文字"の抽象化された可視的表現(abstract visible representation)である。

したがって, この学会試行標準が規定する文字図形集合は, その1部又は全部の要素が, ある特定の符号化文字集合の字体又は字形を指し示すものとして用いられ得るが, 特定の符号化文字集合そのものであることはない。


4. 懸案事項

非漢字類に関する規定ついては, 今後の課題とする。


5. 参考文献

a) 漢和辞典: 石川忠久, 遠藤哲夫, 小和田顕 (福武書店)

b) 大漢和辭典: 諸橋轍次, 補遺 鎌田正 (大修館書店)

c) 甲骨文字字釋綜覽: 松丸道雄, 高嶋謙一 (東京大学出版会)

d) 梵字必携: 児玉義隆 (朱鷺書房)

e) 西夏語の研究: 西田龍雄 (座右宝刊行会)

f) 篆刻篆書字典: 牛窪梧十 (二玄社)

g) 言語学大辞典別巻 世界文字辞典 "漢字","漢字文化圏の文字","日本の文字": 笹原宏之 (三省堂)

h) 日本古代土地経営関係史料集成 東大寺領 北陸偏: 小口雅史 (同成社)

i) 漢字字形要素構成率から見る漢字概念: 古家時雄 (文字鏡研究会会報)

j) 大規模漢字システム: 漢字文献情報処理研究 創刊号, 谷本玲大 (好文出版)

備考 この学会試行標準に整合したCD-ROM版及びウェブ版の検索システム, 並びに文字図形のビットマップフォント配信サービスが, 紀伊國屋書店(http://www.mojikyo.com)から提供されている。


6. 原案作成委員会

この学会試行標準(IPSJ-TS)の原案を作成した社団法人情報処理学会 情報規格調査会の学会試行標準委員会及び作業グループ2(WG2)の委員構成を, その順に次に示す。

解説表6.1 学会試行標準委員会
氏名所属
委員長石崎 俊慶應義塾大学
委員大野 義夫慶應義塾大学
筧 捷彦早稲田大学
島倉 達郎株式会社東芝
竹内 正株式会社トリム・アソシエイツ
田中 邦麿帝京平成大学
棟上 昭男東京工科大学
新田 恒雄豊橋技術科学大学
橋本 美奈子富士通株式会社
藤村 是明独立行政法人 産業技術総合研究所
山崎 信行慶應義塾大学


解説表6.2 作業グループ2(WG2)
氏名所属
主査古家 時雄株式会社エーアイ・ネット
委員相田 満国文学研究資料館
黒田 信二郎株式会社紀伊國屋書店
小林 龍生株式会社ジャストシステム
小町 祐史パナソニックコミュニケーションズ株式会社
谷本 玲大財団法人無窮会
二階堂 善弘茨城大学
谷田貝 常夫文字鏡研究会