TeXLiveを勉強する時間がなさそうなので、これまでどおりW32TeX(角藤版;W32TeX - TeX Wiki)をインストール。texinst2012.exeから。文字鏡フォントにするかどうかが、僕の最大の問題なわけだが、これまた問題を先送りにしてotfパッケージで行くことにする。
ここ(→OTF - TeX Wiki)の情報によれば、OTFパッケージは別立てでインストールということだが、最新版のW32TeXにはすでに含まれていた。「フォントを埋め込まず使用」では、dvipdfmxを使うので(上記サイトではdvipdfm)、$TEXMF/fonts/map/dvipdfm/base/cid-x.mapに該当部分を追加記述。
上記サイトでのお題↓がどうなるかというと。
それで、一昨年まではデータベースをsjisで作成していて、JIS第1、第2水準に含まれないものは大漢和辞典番号(というか文字鏡番号)を使って\PMO{****}みたいに表示していた。文字鏡フォント利用を前提とした方法。別エントリで書いたように、この1年くらいはようやくUnicodeでデータベースを作成しつつある。ファイル上で字形が表示される方が確かに利便性が高い。打ち間違えとか目でわかるものね。
(参考)niji wo mita: ユニコードでデータセットを作る
ところがOTFパッケージを利用する仕組みは、TeXソース上ではコード参照せよということになっている。\CID{****}みたいにして。データベースに表示された字形を手がかりにグリフ一覧(→www.adobe.com/content/dam/Adobe/en/devnet/font/pdfs/5078.Adobe-Japan1-6.pdf)から該当コードを探す。かなりやってられない感じです。文字鏡以前の世界に戻った。
もちろんそういう非効率があれば、どなたかが対応を考えてくださるのがWEBの常であって、こういうプログラムがすでに存在している(UTF-8 による TeX 文書の作成 --- Utf82TeX)。つまりTeXソースではUnicodeで字形を表示させておき、このプログラムを通せば、Jis第1、第2水準以外はきちんと\CID{****}にコード化されるらしい。Utf82TeXの機能のうち、欲しいのは以下。
秀丸エディタのマクロやEmacsを使うみたいだ。これは課題。そういえば、WinでもEmacs使えるのですね(→Windows7でemacs - yusatの日記)。
ここ(→OTF - TeX Wiki)の情報によれば、OTFパッケージは別立てでインストールということだが、最新版のW32TeXにはすでに含まれていた。「フォントを埋め込まず使用」では、dvipdfmxを使うので(上記サイトではdvipdfm)、$TEXMF/fonts/map/dvipdfm/base/cid-x.mapに該当部分を追加記述。
上記サイトでのお題↓がどうなるかというと。
こうなる。%%% -*- mode: yatex; Coding: iso-2022-jp; Encoding: ISO-2022-JP -*- \documentclass{jarticle} \usepackage{otf} \begin{document} Adobe-Japan1-5で追加された文字を使った例 \begin{itemize} \item 「\゜か」,「\゜き」,「\゜く」,「\゜け」,「\゜こ」, 「\゜カ」,「\゜キ」,「\゜ク」,「\゜ケ」,「\゜コ」は鼻濁音を表す。 \item Macintosh用キーボードの\UTF{2318}(Command key)を押す。 \item \UTF{2672}を心がけよう。 \end{itemize} Adobe-Japan1-6で追加された文字を使った例 \begin{itemize} \item ほげほげ番組\CID{20556} \item ほげほげフェスティバル\CID{20656} \item \CID{20939}(Bq: becquerel)は放射能の強さを表す単位である。 \item フラーレン(fullerene) C$_{60}$は サッカーボール状(\CID{20957})の構造をしている。 \item \UTF{9B87}とは岩魚(イワナ)のことであり,嘉魚とも書く。 \end{itemize} \end{document}
それで、一昨年まではデータベースをsjisで作成していて、JIS第1、第2水準に含まれないものは大漢和辞典番号(というか文字鏡番号)を使って\PMO{****}みたいに表示していた。文字鏡フォント利用を前提とした方法。別エントリで書いたように、この1年くらいはようやくUnicodeでデータベースを作成しつつある。ファイル上で字形が表示される方が確かに利便性が高い。打ち間違えとか目でわかるものね。
ところがOTFパッケージを利用する仕組みは、TeXソース上ではコード参照せよということになっている。\CID{****}みたいにして。データベースに表示された字形を手がかりにグリフ一覧(→www.adobe.com/content/dam/Adobe/en/devnet/font/pdfs/5078.Adobe-Japan1-6.pdf)から該当コードを探す。かなりやってられない感じです。文字鏡以前の世界に戻った。
もちろんそういう非効率があれば、どなたかが対応を考えてくださるのがWEBの常であって、こういうプログラムがすでに存在している(UTF-8 による TeX 文書の作成 --- Utf82TeX)。つまりTeXソースではUnicodeで字形を表示させておき、このプログラムを通せば、Jis第1、第2水準以外はきちんと\CID{****}にコード化されるらしい。Utf82TeXの機能のうち、欲しいのは以下。
JIS X 0208 (JIS 第一・第二水準) に含まれない Unicode CJK 漢字を \UTFx{UCS2十六進数形式} もしくは \CIDx{CID番号} 形式に変換して出力する(以下「OTF 変換」). 標準では日本語として扱い \UTFM | \CID に変換されるが,\CIDC, \CIDT に変換される場合がある. \UTFx の x は日本語,中国語簡体字,中国語繁体字,韓国語に応じて,それぞれ M, C, T, K となる. \CIDx の場合は同様にそれぞれ \CID, \CIDC, \CIDT, \CIDK となる. Unicode CJK Unified Ideographs Extension B: CJK 統合漢字拡張 B 領域(U+20000 超のサロゲートペア)の文字もサポートしている.変換は CJK 変換テーブルに依存する. \UTFx, \CIDx は,齋藤修三郎氏による OTF パッケージ(開発版)の提供するコントロールシーケンスである.
秀丸エディタのマクロやEmacsを使うみたいだ。これは課題。そういえば、WinでもEmacs使えるのですね(→Windows7でemacs - yusatの日記)。
コメント