コンピュータで日本語を扱おうとすると、いちばん問題になるのは漢字である。一般のワープロでは、6300字を超える漢字が使えるので、もう十分と考えている人も多い。特に、コンピュータ技術者に多い。
しかし、今のコンピュータの漢字では、残念ながら多くの分野で記述できないものが出てくる。まず、人名、地名、社名が大問題である。6300字程度では、とてもこれらの固有名詞を網羅できない。適当に別の字を使わなければならない。それで、役所の事務処理をコンピュータ化するため、あらゆる固有名詞をコンピュータの字に変えさせようという動きがある。まあ、はっきりいって無茶苦茶である。
難しい歴史書とか漢籍、教典の類いだけが今のワープロの漢字で取り扱えないと思っている人がいるが、とんでもない。小学校の教科書だって困るのである。森鴎外の「鴎」は略字である。こんな字で印刷している本は、まず無い。「区」は「區」が正しい。
さらに困るのは、ワープロで原稿を書いて編集部に渡しても、ワープロで使っているコンピュータ文字と現在印刷で使う写植文字には何ら対応がない。だから、ワープロで俗字になっていても、印刷すると正字になっていたりする。さらに困るのは、写植文字は、印刷屋毎に異なる。正確には、写植機毎に異なるのだ。
本の中で一番部数が出て、長期間にわたって売れ続けているのが文庫本である。いくら文庫が低調だといっても、人々が読む量から言えば大変比重が高い。文庫本は、文字が並んでいるだけだから、本来ならばコンピュータ化が一番進んでも良さそうな分野であるが、実は一番進んでいない。内容さえあっていれば漢字なんて適当でよい実用書の世界と違い、漢字の形にまでこだわる世界である。そもそも漢字はその形に意味がある。だから、形を適当に略してしまっては、文章そのものが台無しになることも多い。
テレビゲームなどの低俗と思われているゲームの解説本、攻略本すら作るのに困ることがあるのだ。原稿をどうやってもワープロでは書けないので、手書きで書いて、写植の段階で文字を捜すこともある。ちなみに、電算写植では大体1万文字の漢字が標準で使用できる。今は、殆どの書籍が電算写植で行なわれており、これだけの文字があれば一般的な本は大丈夫らしい。
漢字は、1970年代には殆どコンピュータでは取り扱えなかった。漢字を表示したり、印刷することが重要な研究テーマであった。1980年代後半から急激に漢字の使用が浸透し、1990年代はワープロの大衆化時代である。今では、作家はワープロで原稿を書くのが当然になった。手書き原稿など、余程実力を認められた人でないと編集部は見向きもしない。
こんなに普及したのであるが、その漢字は誰が作っているだろうか。誰もが日本人が作っていると思っているだろうが、次第に怪しくなりつつある。漢字は、主に中国、台湾、日本で使われている。似てはいるが、それぞれの国の漢字には特徴があり、交ぜて使うなどとてもできない。しかし、漢字についても国際化の波が押し寄せてきている。
日本政府はまだ何の対策も打っていないようだが、国際規格として中国や台湾の漢字が認められ、将来日本のコンピュータでもその漢字を使えと欧米諸国から圧力がかかりそうな雰囲気すらある。
規格ではなく、実際に日本で使っているコンピュータ上の漢字を提供している漢字メーカーは日本の会社ではなく、海外のメーカーになりつつある。いくらアメリカがソフトウェアで先行しても、日本語だけは日本人にしかできまいと思っていると、もうやばい状況になっている。
日本語全般のコンピュータ利用の研究は、本来はシグマ計画などで行なわれるべきだったのだが、殆ど何も行なわれず、成果もない。シグマ計画に限らず、日本語を特に漢字の面から注目し、実用化などを研究している人は、国内には皆無に近い。現在、日本語の漢字についての研究が一番進んでいるのは、アメリカの文字専門会社である。そこの社員が出している『日本語情報処理』(参考文献14)は非常に素晴らしい本である。理屈だけなら、その著者より詳しい人は日本にもいるが、実際に研究し、結果を論文や本にまとめた人は他にはまだいないようだ。日本ではまだ使えない日本語の漢字を自由に用いながら解説しているのは憎いばかりである。日本の漢字のプロ達はいったい何をやっているのだ。
漢字はアルファベットとは根本的に違う。アルファベットは大文字、小文字、特殊記号がついているのも入れたって百個程度に過ぎない。しかし、漢字は何個あるのかさえはっきりしない。画数なんて漢和辞典毎に異なる字もある。部首になるともう混乱も甚だしい。全てが渾沌としているのはいかにも東洋的かもしれないが、このあたりからして認識しないと何もできない。コンピュータ漢和辞典が使える日はまだ遠い。
マルチメディア、インターネット、電子辞書、電子図書館など、文字を含めたコンピュータの高度利用が進もうとしているが、肝腎要の漢字についての検討は皆無である。興味のある研究者が、これではいけないと、細々と自主研究をしている程度である。
今でも実際に実務をやっている方々からは漢字についての不満を聞く。どうやったって、入力したい漢字をコンピュータが拒否する訳だから。
教典、聖典と言われる宗教関係の本は隠れたベストセラーである。そういう世界の書籍も、コンピュータ利用で作らざるを得なくなるのは時間の問題である。そのとき、教典、聖典の漢字はいったいどう変化していくのだろうか。そして戒名は。
コンピュータでの漢字利用に関するインターネットなどでの意見発表は数の上では盛んであるし、公開会議を開いたりすると人が集まる。しかし、議論は的外れが非常に多い。コンピュータの技術上の話ばかりが多く、実際に本を作ったり、辞書の編纂をしたりした人が殆ど現われない。殆ど全ての書類の電子化において、漢字は避けて通れない。今はいい加減な知識しかない人が多く、使える漢字を現在コンピュータで扱える漢字に強制的に直させようとさえしている省庁もある。
シグマ計画の250億円は完全無欠の無駄になったが、これからでも同じ250億円をコンピュータで利用できる漢字の研究開発に使えば、無駄になることは決してないだろう。それにしても、こういうことを何も理解せずに行なっている国立国会図書館の「電子図書館」プロジェクトは、無知蒙昧も甚だしい。大卒どころか、義務教育終了程度の学力があるかどうかさえ疑わしい。