スキップしてメイン コンテンツに移動

10万字版はvistaに対応しにくく、15万字版はTeXに対応せず

さて、TeX環境である。平安鎌倉期の漢字文献を取り扱うという専門の性質上、多漢字環境の構築は必須、で、文字鏡フォントに依存した環境を利用している。今回は(も?)インストールに苦労したので、以下メモ。

まずはTeXの環境づくりだが、例によってTeX Wikiを見ながらひとつずつインストールはめんどくさいなあと思って、ネットを検索しているとTeXインストーラ3 0.72(→TeXインストーラ3 0.72)を使うと、dvioutからgs関連ソフトまで、自動でftpからダウンロードしてインストールしてくれるという。vistaの成功例もあるようだからと思ってトライしたが、インストールが完了しても、うまく文書ファイルがコンパイルされない。PATHが通っていないので環境変数を書き込んでもうまく行かない…。

結局、インストール(Windows) - TeX Wikiを見ながらゼロから環境構築して行くと、途中で自動インストーラと、この手動の方法では、なぜかディレクトリ構造が違うことに気づいた。通したと思い込んでいたPATHが違ったようだ。でも、そもそもインストーラがPATHを間違えるはずはないし、原因はよく分からない。手動インストールでは、TeX Wikiの説明に完全に従ったので、問題なく文書ファイルがコンパイルされた。

つづいてTeX用文字鏡フォントのインストールだが、参照したWindows 用 TeX で文字鏡フォントを利用する方法の情報は少し古い。文字鏡研究会はフォントのダウンロードサービスを停止している(ダウンロードサービスの中止について)。サーバ移転のため2008年2月から約1年の停止というから、そろそろの開始となるのだろう。代わりにスタンフォード大学のサイトからダウンロードせよとの指示に従ってクリックすると、今度はStanford University: Page not found!となる。結局、すでにTeX用文字鏡フォントがインストールされているパソコンからコピーして事なきを得た。

ちなみに僕はいまだに10万字版今昔文字鏡を使っている。現状で大きな問題にぶつかったことはない。15万字版では何が増えたのかネットで検索する限りは詳細は分からないが、5万字分利便性が高まったのだろう、と想像する。10万字版はvistaでは実害はない程度の不具合が出る。15万字版ではvistaへの対応があるようだ(→バージョンアップ情報)。いずれ15万字版を購入するときは、あわせてTeX用フォントも導入したかったがダウンロードサービスの中止についてによれば、2008年2月の段階で作成すらしていないようだ。

つまり、vistaを使えばいずれ10万字版は使えないか使いにくい状況となり、vistaに対応している15万字版を使えばTeXに対応しない部分が問題となる。というところでWindows 用 TeX で文字鏡フォントを利用する方法を見れば、冒頭に次のようにある。

最近では,様々な文字を取り扱うには utf/otf パッケージの方が文字鏡パッケージよりも一般的に使われるようになりました。今後は大きな変更が無い限りこのページのメンテナンスを停止いたします。


でもutf/otfでは2万数千字しか使えないのでは…(→OTF - TeX Wiki)。どうなる、この領域の研究者は。多漢字環境をTeXでどう保証するの。

コメント

匿名 さんのコメント…
突如の訪問恐れ入ります。
同様の悩みを抱えてネットをさまよい、ここにたどり着きました。

内部Unicode化のためだと思われますが、日本語TeXの開発やメンテもちょっと伏流気味になってるようです。いろいろダウンロードできません。

30年も昔、2バイトコード化で苦労された方々は、漢字=絵文字=使う人は低能、という米国を中心としたコンピュータ文化(というか欧米の思い込み)と戦っていました。白人世界でも2バイトコードでなければ表示できない国もあることがわかって改善されました。

その後は当用漢字以外をどう扱うかで大変な苦労の結果、私は学術用には無理だと思うのですが、中国人・韓国人のおおせいな縄張り意識の効果で、Unicodeになりました。日本語TeXの世界も今、前期のように内部Unicode化に統一される直前になってます。

この騒ぎの中で学術用にも使える今昔文字鏡とかGTフォントも埋め込めるようになってきたのですが、置き去りですね。

漢字を使う世界は日本以外は実は歴史は半世紀程度しかない国々だし、古文書(20世紀の文書も含まれます)を自国民が解読して歴史を自律的に学ぶことは歓迎しないでしょう。政府文書が表示できればそれ以上は関係ないのです。

2バイトコード化、文字コードの拡大、というムーヴメントでは多くのコンピュータ科学者が関与しましたが、再び「学術」用にという願いには無関心になってしまったようです。彼らにとってはひと段落してしまったからですね。

それから今昔文字鏡についてはうさんくさい話がつきまとうので、利用者・開発者が離れてしまっているようです。「通信用語の基礎知識」というサイトで「今昔文字鏡」については、

「今昔文字鏡には、不用意に関わり合いを持たない方が良いと考えられ、実際に多くの漢字文字を扱おうとするグループはこことは別個に文字の収集と附番の活動を行なっているのである」

などとまで書かれてしまっています。私も非売品の紀要であっても、今昔文字鏡のフォントを埋め込んだままで今後だいじょうぶかな、と不安も持っています(可能な部分はGTフォントに置き換えるなどしています)。ご指摘のサイトが今昔文字鏡向けのサポートをやめるというのもこの流れかと思います。
NJM さんの投稿…
お返事遅くなってすみません。このブログの特徴です。

有用な情報ありがとうございます。同様の悩みを抱えていらっしゃるとのこと、心中お察しします。

TeXの世界もUnicode化が進んでいるのですね。しばらく古いjisの世界に安住していたので、気づけば周囲の変化に驚いている次第です。

しかし今昔文字鏡がTeXのサポートをやめるとなると、多漢字環境を取るか、TeXを取るかという話になりますね。多漢字環境自体を作れない私のような研究者は途方に暮れるばかりです。

このブログの人気の投稿

あさって、やなさって、しあさって、さーさって

授業で、言語地理学の基礎を取り扱うときに出す、おなじみのLAJこと日本言語地図。毎年、「明日、明後日、の次を何と言うか」を話題にするのだが、今年はリアクションペーパーになんだか色々出てきたのでメモ。これまでの話題の出し方が悪かったのかな。 明後日の次( DSpace: Item 10600/386 )は、ざっくりしたところでは、伝統的には東の国(糸魚川浜名湖ライン以東)は「やのあさって(やなさって)」、西の国は古くは「さーさって」それより新しくは「しあさって」。その次の日( DSpace: Item 10600/387 )は、伝統的には東西どちらもないが、民間語源説によって山形市近辺では「や(八)」の類推で「ここのさって」、西では「し(四)」の類推で「ごあさって」が生まれる、などなど(LAJによる)。概説書のたぐいに出ている解説である。LAJがウェブ上で閲覧できるようになって、資料作りには便利便利。PDF地図は拡大縮小お手の物ー。 *拡大可能なPDFはこちら 日本言語地図285「明明後日(しあさって)」 *拡大可能なPDFはこちら 日本言語地図286「明明明後日(やのあさって)」 さて、関東でかつて受け持っていた非常勤での学生解答は、「あした あさって しあさって (やのあさって)」がデフォルト。やのあさっては、八王子や山梨方面の学生から聞かれ、LAJまんまであるが、ただし「やのあさって」はほとんど解答がない。数年前にビールのCMで「やのあさって」がちらりと聞ける、遊び心的な演出があったが学生は何を言っているのかさっぱりだったよう。これはかつての東国伝統系列「あした あさって やのあさって」に関西から「しあさって」が侵入して「やのあさって」は地位を追い落とされひとつ後ろにずれた、と説明する。「あした あさって やのあさって しあさって」は期待されるが、出会ったことがない。 山形では「あした あさって やなさって (しあさって)」と「あした あさって しあさって (やなさって)」はほとんど均衡する。これには最初驚いた。まだあったんだ(無知ゆえの驚き)!と(ただしLAJから知られる山形市の古い形は「あした あさって やなさって さーさって」)。同じ共同体内で明後日の翌日語形に揺れがある、ということは待ち合わせしても出会えないじゃないか。というのはネタで、実際は「~日」と...

お尻はいくつか

子どもが友人たちと「お尻はいくつか」という論争を楽しんだらしい。友人たちの意見が「お尻は2つである」、対してうちの子どもは「お尻は1つである」とのこと。前者の根拠は、外見上の特徴が2つに割れていることにある。後者の根拠は、割れているとはいえ根元でつながっていること、すなわち1つのものが部分的に(先端で)2つに割れているだけで、根本的には1つと解釈されることにある。白熱した「お尻はいくつか」論争は、やがて論争参加者の現物を実地に確かめながら、どこまでが1つでどこからが2つかといった方向に展開したものの、ついには決着を見なかったらしい。ぜひその場にいたかったものだと思う。 このかわいらしい(自分で言うな、と)エピソードは、名詞の文法範疇であるところの「数(すう)」(→ 数 (文法) - wikipedia )の問題に直結している。子どもにフォローアップインタビューをしてみると、どうもお尻を集合名詞ととらえている節がある。根元でつながっているということは論争の中の理屈として登場した、(尻だけに)屁理屈であるようで、尻は全体で一つという感覚があるようだ。つながっているかどうかを根拠とするなら、足はどう?と聞いてみると、それは2つに数えるという。目や耳は2つ、鼻は1つ。では唇は?と尋ねると1つだという。このあたりは大人も意見が分かれるところだろう。僕は調音音声学の意識があるので、上唇と下唇を分けて数えたくなるが、セットで1つというのが大方のとらえ方ではないだろうか。両手、両足、両耳は言えるが、両唇とは、音声学や解剖学的な文脈でなければ言わないのが普通ではないかと思う。そう考えれば、お尻を両尻とは言わないわけで、やはり1つととらえるのが日本語のあり方かと考えられる。 もっとも、日本語に限って言えば文法範疇に数は含まれないので、尻が1つであろうと2つであろうと形式上の問題になることはない。単数、複数、双数といった、印欧語族みたいな形式上の区別が日本語にもあれば、この論争には実物を出さずとも決着がついただろうに…。大風呂敷を広げたわりに、こんな結論でごめんなさい。尻すぼみって言いたかっただけです。

thinkpad x200起動せず→復旧

thinkpad x200が起動しないという謎の事態に陥ったが、どうにか復旧した。僕くらいの素人+α向けのチュートリアルがなかったのでメモしておく。 そもそもは、このところ相次いだwin vistaのアップデートにまかせるままにしていたら、スリープ後に復旧しないという現象が起こったことがきっかけ。いや、ちょっと前からスリープに入る時点で勝手に復旧されて蓋を閉じることができないことも続いていた。ネットを検索すると、x200に限らずスリープで失敗するのはウインドウズの問題としてちょくちょく起こっている模様。めんどいのでubuntuを起動して使ったりしていたが思い立って根本的解決を図ろうとする。 で、x200のBIOSの問題もあろうと考えて、ThinkVantageを使用してもろもろアップデート。170MBくらいあったか。作業工程の96%間際にBIOSのアップデートが入り、自動的にシャットダウン&リスタートとなった途端に起動しなくなった。 症状は電源はONになっているのに、画面には一切表示されない(黒背景)というもの。2ちゃんの書き込み( 上の解説にある通りCMOSバッテリ外したらクリアできると思うけど、BIOSが壊れてたら意味ないかも )に基づいて、CMOSバッテリ外し=CMOSクリアを行う。筐体の開け方は、 Service Videos にて懇切丁寧な説明が。CRU Removal/Replacements>CMOS Batteryへと進む。あとはRemoveとReplaceのビデオを見ながらクリア。途中、画像が小さくて見にくいところもあるので、撮影した写真を貼り付けておく。 キーボードとパームレストを外したところ。向かって奥がディスプレイ。中央の黄色いのがCMOSバッテリー。 CMOSバッテリーから伸びている白いケーブルを、白いコネクタからそっと外す。何となくそのまま30秒くらい放置して(意味あるかは分からない)、またつなぐ。 ここのところ。あとはビデオにしたがって組み立て直す。 バッテリーをくっつけて、電源ケーブル差し込んでスイッチオン。何度か落ちる。意味不明。が、起動の画面が立ち上がるので、すかさずF1キーを押す。BIOSセットアップ画面に入るので、 このマニュアル にしたがって、BIOSを初期状態に戻す。 BIOSを初期設定に戻す方法 「バージョン情報」の章...