Unicode は世界の主要な言語(アラビア語、中国語、ギリシア語、ヘブライ語、日本語、ローマ字、ロシア語、その他の多くの言語)の文字を、単一の文字コード体系で処理する仕組みです。Cocoa のテキスト処理は Unicode がベースになっているので、TeXShop でもそのまま Unicode を扱うことができます。Unicode が実際にどんな感じなのか試してみるには、「システム環境設定」から「言語環境」を開き、「入力メニュー」タブで、すでに「入」になっているものに加えて別の言語を選んでみてください。たとえば、ギリシア語(よく知られていますね)、ヘブライ語(右から左へ書きます)、アラビア語(右から左へ書くうえ、リガチャ〔合字〕を広範に使用するので語末と語中とでは字体が異なります)、あるいは中国語などを選んでみるとわかりやすいでしょう。追加した入力メニューは、現在の入力言語を示す国旗で表示されます。
数文字打ち込んでみてから、他の言語に変え、さらにまた打ち込んでみます。
Unicode ファイルにはいくつかの形式があります。環境設定項目ではそのうちの2つを選べます。標準的な OS X Unicode は Mac OS X ではよく使われますが、これが TeX の世界で有用なのかどうかについてはわかりません。UTF-8 Unicode は、普通の ASCII キャラクターが普通に表示されるので人気の高い方式です。UTF-8 形式でファイルを保存すれば TeX で処理することができますが、Unicode 文字は疑問符に置き換えられてしまいます。
UTF-8 Unicode で入力されたファイルを扱える TeX パッケージもあります ; 下記を参照してください──
(訳注:リンク不全。以下を参照)
「UTF パッケージ対応」について
TeXShop 1.35 では、pTeX 用にUTF パッケージ(utf.sty)がサポートされるようになりました。
環境設定パネルの「詳細」タブ内に「UTF パッケージ対応」という項目があります。ここにチェックを入れることで TeXShop は、pTeX が対応してない文字(JIS X0208 以外の文字)を utf.sty の形式に変換します。たとえば、Unicode 文字は \UTF{Hex code} となり、非-Unicode 文字は \CID{glyph ID} となります。
この機能がサポートされたことによる利点は、TeXShop 内蔵のエディタで「鷗」や「閒」といった文字を直に入力できる、ということです。言い換えれば、コード表を調べたうえで本文中に \UTF{9DD7} や \UTF{9592}(ないしは \CID{07646} や \CID{08685} )などと書く手間が省けるということです。
利用するにあたっては、utf.sty をインストールしたうえで、プリアンブル部に、
UTF パッケージ・OTF パッケージについてのさらに詳しい情報は、以下をご覧ください。
【補足】
- 小川版の pTeX パッケージを導入した場合は、インストール時に組み込まれるので、改めて utf.sty をインストールする必要はありません。
- 「UTF パッケージ対応」機能は、日本語系のすべてのエンコーディング方式で利用可能ですが、SJISX0213 については、これに対応した pTeX パッケージを利用する必要があります。
- グリフ機能(CID)を使うときには、ヒラギノフォントを用いるのが無難でしょう。
上級向けのヘルプUnicode(ユニコード)