スキップしてメイン コンテンツに移動

Win7+W32TeX+OTFパッケージ

TeXLiveを勉強する時間がなさそうなので、これまでどおりW32TeX(角藤版;W32TeX - TeX Wiki)をインストール。texinst2012.exeから。文字鏡フォントにするかどうかが、僕の最大の問題なわけだが、これまた問題を先送りにしてotfパッケージで行くことにする。

ここ(→OTF - TeX Wiki)の情報によれば、OTFパッケージは別立てでインストールということだが、最新版のW32TeXにはすでに含まれていた。「フォントを埋め込まず使用」では、dvipdfmxを使うので(上記サイトではdvipdfm)、$TEXMF/fonts/map/dvipdfm/base/cid-x.mapに該当部分を追加記述。

上記サイトでのお題↓がどうなるかというと。
%%% -*- mode: yatex; Coding: iso-2022-jp; Encoding: ISO-2022-JP -*-
\documentclass{jarticle}
\usepackage{otf}
\begin{document}
Adobe-Japan1-5で追加された文字を使った例
\begin{itemize}
  \item 「\゜か」,「\゜き」,「\゜く」,「\゜け」,「\゜こ」,
        「\゜カ」,「\゜キ」,「\゜ク」,「\゜ケ」,「\゜コ」は鼻濁音を表す。
  \item Macintosh用キーボードの\UTF{2318}(Command key)を押す。
  \item \UTF{2672}を心がけよう。
\end{itemize}

Adobe-Japan1-6で追加された文字を使った例
\begin{itemize}
  \item ほげほげ番組\CID{20556}
  \item ほげほげフェスティバル\CID{20656}
  \item \CID{20939}(Bq: becquerel)は放射能の強さを表す単位である。
  \item フラーレン(fullerene) C$_{60}$は
        サッカーボール状(\CID{20957})の構造をしている。
  \item \UTF{9B87}とは岩魚(イワナ)のことであり,嘉魚とも書く。
\end{itemize}
\end{document}
こうなる。

それで、一昨年まではデータベースをsjisで作成していて、JIS第1、第2水準に含まれないものは大漢和辞典番号(というか文字鏡番号)を使って\PMO{****}みたいに表示していた。文字鏡フォント利用を前提とした方法。別エントリで書いたように、この1年くらいはようやくUnicodeでデータベースを作成しつつある。ファイル上で字形が表示される方が確かに利便性が高い。打ち間違えとか目でわかるものね。
  • (参考)niji wo mita: ユニコードでデータセットを作る

  • ところがOTFパッケージを利用する仕組みは、TeXソース上ではコード参照せよということになっている。\CID{****}みたいにして。データベースに表示された字形を手がかりにグリフ一覧(→www.adobe.com/content/dam/Adobe/en/devnet/font/pdfs/5078.Adobe-Japan1-6.pdf)から該当コードを探す。かなりやってられない感じです。文字鏡以前の世界に戻った。

    もちろんそういう非効率があれば、どなたかが対応を考えてくださるのがWEBの常であって、こういうプログラムがすでに存在している(UTF-8 による TeX 文書の作成 --- Utf82TeX)。つまりTeXソースではUnicodeで字形を表示させておき、このプログラムを通せば、Jis第1、第2水準以外はきちんと\CID{****}にコード化されるらしい。Utf82TeXの機能のうち、欲しいのは以下。
    JIS X 0208 (JIS 第一・第二水準) に含まれない Unicode CJK 漢字を \UTFx{UCS2​十六進数形式} もしくは \CIDx{CID​番号} 形式に変換して出力する(以下「OTF 変換」). 標準では日本語として扱い \UTFM | \CID に変換されるが,\CIDC, \CIDT に変換される場合がある. \UTFx の x は日本語,中国語簡体字,中国語繁体字,韓国語に応じて,それぞれ M, C, T, K となる. \CIDx の場合は同様にそれぞれ \CID, \CIDC, \CIDT, \CIDK となる. Unicode CJK Unified Ideographs Extension B: CJK 統合漢字拡張 B 領域(U+20000 超のサロゲートペア)の文字もサポートしている.変換は CJK 変換テーブルに依存する. \UTFx, \CIDx は,齋藤修三郎氏による OTF パッケージ(開発版)の提供するコントロールシーケンスである.

    秀丸エディタのマクロやEmacsを使うみたいだ。これは課題。そういえば、WinでもEmacs使えるのですね(→Windows7でemacs - yusatの日記)。

    コメント

    このブログの人気の投稿

    三つ葉をミツパと呼ぶ理由

    山形で、あるいは言葉によっては東北で広く聞かれる変わった発音に、関東では濁音でいうところを清音でいうものがある。「ミツパ(三つ葉)」「ナガクツ(長靴)」「ヒラカナ(平仮名)」「イチチカン(一時間)」「〜トオリ(〜通り:路の名前)など。小林好日『東北の方言』,三省堂1945,p.74にはこれに類した例が、説明付きでいくつか挙がっている(音声記号は表示がめんどいので略式で。なおnは1モーラ分ではなく、鼻に抜ける程度の入り渡り鼻音(njm注))。 鼻母音があるとその次の濁音が往々にして無声化し、その上にその次の母音まで無声化させることがある。  ミツパ(三つ葉) mitsunpa  マツパ(松葉) matsunpa  マツ(先づ) mantsu  クピタ(頚) kunpita  テプソク(手不足) tenpusoku  カチカ(河鹿) kanchika  ムツケル(むずかる・すねる) muntsukeru この無声化はなほそのあとの音節にまで及ぶこともある。  アンチコト(案じ事) anchikoto  ミツパナ(水洟) mitsunpana この現象は法則的に起こるのではなく、あくまでも語彙的・個別的に生じている。これって、どうしてこういうの?ということを仮説立ててみる。 * * * * * 伝統的な東北方言では、非語頭の清濁は鼻音の有無で弁別される。よく教科書に挙がる例では以下がある。 mado(的):mando(窓) kagi(柿):kangi(鍵)*ngiは鼻濁音で現れる場合と、入り渡り鼻音+濁音で現れる場合とあり 語頭では他の方言と同様に有声音と無声音の対立があり、非語頭では上記のような鼻音と非鼻音の対立がある(そして有声音と無声音は弁別には関与しない)のが特徴的と言われるが、こうした弁別体系は古代日本語の残照と言われることもある。実証的な論考で明示されたことではないのだが、多くの概説書で「〜と考えられている」といった程度には書かれており、定説とは言わないまでも通説と言ってよいだろう。 非語頭の濁音音節前に現れる入り渡りの鼻音は、中世の宣教師による観察にも現れているので、比較的最近まで(日本語史は中世も最近とかうっかり言います)近畿方言にも残っていたとされる。このあたりは文献資料でも確かめられるために、実証的な論考でも言い尽くされているところ。 さて、古代日本語

    お尻はいくつか

    子どもが友人たちと「お尻はいくつか」という論争を楽しんだらしい。友人たちの意見が「お尻は2つである」、対してうちの子どもは「お尻は1つである」とのこと。前者の根拠は、外見上の特徴が2つに割れていることにある。後者の根拠は、割れているとはいえ根元でつながっていること、すなわち1つのものが部分的に(先端で)2つに割れているだけで、根本的には1つと解釈されることにある。白熱した「お尻はいくつか」論争は、やがて論争参加者の現物を実地に確かめながら、どこまでが1つでどこからが2つかといった方向に展開したものの、ついには決着を見なかったらしい。ぜひその場にいたかったものだと思う。 このかわいらしい(自分で言うな、と)エピソードは、名詞の文法範疇であるところの「数(すう)」(→ 数 (文法) - wikipedia )の問題に直結している。子どもにフォローアップインタビューをしてみると、どうもお尻を集合名詞ととらえている節がある。根元でつながっているということは論争の中の理屈として登場した、(尻だけに)屁理屈であるようで、尻は全体で一つという感覚があるようだ。つながっているかどうかを根拠とするなら、足はどう?と聞いてみると、それは2つに数えるという。目や耳は2つ、鼻は1つ。では唇は?と尋ねると1つだという。このあたりは大人も意見が分かれるところだろう。僕は調音音声学の意識があるので、上唇と下唇を分けて数えたくなるが、セットで1つというのが大方のとらえ方ではないだろうか。両手、両足、両耳は言えるが、両唇とは、音声学や解剖学的な文脈でなければ言わないのが普通ではないかと思う。そう考えれば、お尻を両尻とは言わないわけで、やはり1つととらえるのが日本語のあり方かと考えられる。 もっとも、日本語に限って言えば文法範疇に数は含まれないので、尻が1つであろうと2つであろうと形式上の問題になることはない。単数、複数、双数といった、印欧語族みたいな形式上の区別が日本語にもあれば、この論争には実物を出さずとも決着がついただろうに…。大風呂敷を広げたわりに、こんな結論でごめんなさい。尻すぼみって言いたかっただけです。

    あさって、やなさって、しあさって、さーさって

    授業で、言語地理学の基礎を取り扱うときに出す、おなじみのLAJこと日本言語地図。毎年、「明日、明後日、の次を何と言うか」を話題にするのだが、今年はリアクションペーパーになんだか色々出てきたのでメモ。これまでの話題の出し方が悪かったのかな。 明後日の次( DSpace: Item 10600/386 )は、ざっくりしたところでは、伝統的には東の国(糸魚川浜名湖ライン以東)は「やのあさって(やなさって)」、西の国は古くは「さーさって」それより新しくは「しあさって」。その次の日( DSpace: Item 10600/387 )は、伝統的には東西どちらもないが、民間語源説によって山形市近辺では「や(八)」の類推で「ここのさって」、西では「し(四)」の類推で「ごあさって」が生まれる、などなど(LAJによる)。概説書のたぐいに出ている解説である。LAJがウェブ上で閲覧できるようになって、資料作りには便利便利。PDF地図は拡大縮小お手の物ー。 *拡大可能なPDFはこちら 日本言語地図285「明明後日(しあさって)」 *拡大可能なPDFはこちら 日本言語地図286「明明明後日(やのあさって)」 さて、関東でかつて受け持っていた非常勤での学生解答は、「あした あさって しあさって (やのあさって)」がデフォルト。やのあさっては、八王子や山梨方面の学生から聞かれ、LAJまんまであるが、ただし「やのあさって」はほとんど解答がない。数年前にビールのCMで「やのあさって」がちらりと聞ける、遊び心的な演出があったが学生は何を言っているのかさっぱりだったよう。これはかつての東国伝統系列「あした あさって やのあさって」に関西から「しあさって」が侵入して「やのあさって」は地位を追い落とされひとつ後ろにずれた、と説明する。「あした あさって やのあさって しあさって」は期待されるが、出会ったことがない。 山形では「あした あさって やなさって (しあさって)」と「あした あさって しあさって (やなさって)」はほとんど均衡する。これには最初驚いた。まだあったんだ(無知ゆえの驚き)!と(ただしLAJから知られる山形市の古い形は「あした あさって やなさって さーさって」)。同じ共同体内で明後日の翌日語形に揺れがある、ということは待ち合わせしても出会えないじゃないか。というのはネタで、実際は「~日」と