小林龍生

活字箱と漢字の使用頻度(1)

文字情報技術促進協議会(CITPC)の最大の趣旨の一つが、日本の情報通信環境からの外字の解消にあることは、設立当初から一貫して変わっていない。
技術的には、国際標準化という局面では、すでにゴールに到達し、その実装という局面でも、着々とゴールに近づいている。
しかし、その普及という局面では、まだまだゴールまでは遠いなあ、というのが実感だ。
ゴールが遠い理由の一つは、わりと単純で、でも、根が深いところにある。
即ち、既存の文字を探すよりも、外字を作ってしまう方が、簡単で楽だから、という、ちょっとがっかりな事実。
では、それを解決するにはどうしたらいいか。
これも、答えはちょっとバカっぽく単純で、探す(欲しい)漢字を簡単に見つけられるようにすればいい。
このブログの大きなテーマの一つだ。
手始めに、漢字を探すってどういうことなのか、について、しばらく考えていきたい。というか、ぼく的には、結構長く考えてきたわけで。
一つの大きなヒントが、活版時代、採字工の前に置かれていた活字箱。この活字箱に収められていた活字はだいたい4千種類だったと、小林敏さんに聞いたことがある。4千字ね、意外と少ないなあ。
ちなみに、日本の代表的な文字セット/文字集合を見てみると。
常用漢字表:2136種
教育漢字:1026字
JIS X0213(漢字合計):1050字
JIS X0213(第一水準):2965字
JIS X0213(第二水準):3990字
JIS X0213(第三水準):1259字
JIS X0213(第四水準):2436字

常用漢字表の字数を確かめようと思って、文化審議会答申の本文を見ていたら、その「3字種・音訓の選定について」の一部に、「実際に検討した漢字は、調査A(書籍860冊分の凸版組版データ)において、常用漢字としては、最も出現順位の低かった「銑」(4004位)と同じ出現回数を持つ漢字までとしたので、4011字に上る」という記述が目に入った。
このように見てくると、敏さんが言っていた活字箱の4千字という数字は、実践的には、印刷屋さんにとっては、必要にして(ほぼ)十分、という数だったのだろう。

そう言えば、京都の阿辻哲次さんの著書で、父君が印刷屋さんを営んでおり、高校生の阿辻青年が、自転車で足りない活字を買いに行く、という場面が描かれていた。買いに行った活字が、4千字種のうちにあって使用頻度が高かったために底をついたのか、それとも4千字種からはみだした頻度の低い活字だったのか、その既述があったかどうかは、よく覚えていない。
いすれにしても、日ごろから敬服している、阿辻さんの見識と慧眼の背後に、この高校生時代の活字箱の原風景があったであろうことは、想像に難くない。

今日の雑談は、ここまでね。次回は、国立国語研究所の高田智和さんらのJIS X 0213の頻度調査を中心に、もう少し、この辺りのことを考えてみたい。

コメントする

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

Scroll to Top