Coded-Character SetCoded-Character Set Technology
文字技術促進部会
主査 袴田 博之
日本電気株式会社 プラットフォーム・テクノロジーサービス事業部門 シニアエキスパート
Unicode IVS/IVD、及び文字情報基盤に準拠したシステムへ移行する上で、解決されなければならない多く の課題が残されています。特に、符号化方式としてMS-DOSの時代より使用されているシフトJISを用いた システムからの移行には様々な技術的課題があり、複数の暫定的な規格、手法の導入による解決が必要です。
Unicode対応を謳うシステムにおいても、使用している符号化方式、またそのサポートレベルにより、 必要となるツール、暫定仕様が異なっています。具体的には、基本多言語面のみ対応しているシステム、 基本多言語面に加えてサロゲートペアに対応しているシステムなどがあげられます。この他、文字情報基盤で 策定された文字には、符号化を完了しておらず、使用する上で暫定的な符号化を行わなくてはならない 文字が少なくありません。 また、Unicode IVS/IVD、および文字情報基盤に準拠したシステムへ移行する上で、暫定的な符号化(私的領域の使用) は不可避です。暫定的な符号化であっても、各ベンダー間で統一した管理された符号位置を使用することで、 これまでと同様の外字問題としないことが重要です。
文字技術促進部会は、これまでのレガシーなシステムからUnicode IVS/IVD、 および文字情報基盤に対応したシステムへ移行する上で解決するべき課題の確認、および解決、 そして円滑な移行を実現するため手法などについて検討を行っています。
暫定私用コードの作成
Unicode対応システムの多くは サロゲートペアのサポートに留まっています。サロゲートペアへの対応は、UTF-16符号化方式において 1文字16ビット、および16ビット2つにより構成される32ビットへの対応が必要です。一方で、Unicode IVS/IVDへ対応するためには、 ベースとなる文字、そして使用する字形を指定するセレクタの2つの組み合わせにて1文字を構成する仕組みに対応しなくてはなりません。 この仕組みにより1文字は最大64ビットとなるため、従来のサロゲートペアへの対応に加えて様々な追加実装が必要となります。
このような大きな違いから、一時に全てのシステムを更新することは非常に困難です。
当部会は、サロゲートペアのみに対応したシステム、およびUnicode IVS/IVDに対応したシステムの移行の為の共存を可能にする 暫定私用コードの策定、及び対応フォントの開発、提供を行っています。
IVS対応拡張IME辞書
IVS対応により、これまでは容易には使用できなかった様々な異体字を誰もが扱えるようになります。一方で、様々な異体字を区別し、正しく 入力することは非常に困難です。当部会では、異体字入力を支援する『IVS対応拡張IME辞書』の開発、及び提供を行っています。
≪権利関係より辞書の提供は協議会会員のみ≫
文字情報基盤導入支援
Unicode対応システムの多くは サロゲートペアのサポートに留まっています。サロゲートペアへの対応は、UTF-16符号化方式において 1文字16ビット、および16ビット2つにより構成される32ビットへの対応が必要です。一方で、Unicode IVS/IVDへ対応するためには、 ベースとなる文字、そして使用する字形を指定するセレクタの2つの組み合わせにて1文字を構成する仕組みに対応しなくてはなりません。 この仕組みにより1文字は最大64ビットとなるため、従来のサロゲートペアへの対応に加えて様々な追加実装が必要となります。
このような大きな違いから、一時に全てのシステムを更新することは非常に困難です。
当部会は、サロゲートペアのみに対応したシステム、およびUnicode IVS/IVDに対応したシステムの移行の為の共存を可能にする 暫定私用コードの策定、及び対応フォントの開発、提供を行っています。