TeXで書いたテキストがどうしてもコンパイルできない。と思っていたら、そうだこれエンコードがutf-8だったんだよねと思い出して、jisに直してからコンパイルしたらすっきり通った。ずっとjisで論文書いていたものだから、oooのcalc(msで言うところのexcel)でユニコード文字を取扱い始めていたのを忘れていた。
どうなんだろ。日本語史の表記研究やっている人、特に文字研究やっている人はデータを取るときにもうユニコードで取るようにしているというけれど、僕の場合はjisベースでデータを構築してきたから、いまいちユニコードに突入する気持ちになれない。データそのものは大漢和辞典番号で一意に管理しつつ、アウトプットの時だけmojikyo fontwo使っていた。ところがこれがやや年配の共同研究者に受けが悪い。wysiwyg(what you see is what you get)でないのが主要因。あとは今昔文字鏡みたいなソフトがないと対応できなかったり、フォントに奇妙な著作権がくっついていることなんかが原因なんだけど。今年やっている作業からユニコードも使っていいことになった。それはそれで時代の流れかなあとぼんやり思いつつも、問題は共同作業者が同一の文字に対してあるときはユニコード文字、あるときは今昔文字鏡依存みたいな使い方をしているということだ。つまり、what you seeでは同じなんだけど、データ的なwhat you getが同一でない。
これを説明して、きちんと納得してもらうのはものすごく大変なんだよね。それは、データに対する考え方が根本的に違うから。よくwordで作った見栄えの良い印刷文書を、空白が見える設定でデータ分析してみると、スペースなんかで調整したものすごいアナログな手法が見えたりすることがあるじゃないですか。で、バージョンが違ったり互換性のある他のソフトで開くとレイアウト崩れまくり、みたいな(コンピューターに詳しい同僚に言わせれば、あれは悪しき原稿用紙感覚であって、文書作成者には常に見えないマス目があるらしい)。つまり、データそのものと見えている姿の、2つのレイヤーを区別する考え方を理解するまでに一つのハードルがあるわけ。で、そのハードルを越えたところに「見えているのと違うデータが存在しているのはわかるが、いま見えているものの背後にあるデータを手探りで操作するなんて効率的ではない」という、とても大きな断絶があるのね。これを言われてしまうと、ここで起こっているのは異文化接触だぞ、と思ってしまう。
この断絶を無くす努力を共同作業者はするべきなのだろうけれど、この「見えない背後のデータを頭の中で仮定しながら作業する」人と、「見えるデータで作業する」人とは思考の枠組みとしてどちらが優れているというものでもないがゆえに、どちらを取るかは、場や人間関係の力学で決定されてしまう。そしてコードの違いなんて「瑣末」なことは横へ置いておいて、入力作業はサクサク進んでしまうわけ。人と人とは根本的に分かり合えてなくても共同作業ならばするっとできてしまう、ということの証左だなーと思うよ。だからこのエピソードで学べることは、分かり合うような努力をするくらいなら、同じ皿から一緒に飯を食え、ってことだな、といったところで閑話休題。
やっぱりユニコードが扱えるようにTeXの環境づくりからやり直す必要があるんだろう。あ、でも今は今昔文字鏡が使いたいためにwindows環境に出戻りしているけれど、emacsだったらフツーにユニコードに対応してんのかな。どちらにせよ、この原稿を仕上げて、その先の研究会発表を終えてから、なわけだけど。
どうなんだろ。日本語史の表記研究やっている人、特に文字研究やっている人はデータを取るときにもうユニコードで取るようにしているというけれど、僕の場合はjisベースでデータを構築してきたから、いまいちユニコードに突入する気持ちになれない。データそのものは大漢和辞典番号で一意に管理しつつ、アウトプットの時だけmojikyo fontwo使っていた。ところがこれがやや年配の共同研究者に受けが悪い。wysiwyg(what you see is what you get)でないのが主要因。あとは今昔文字鏡みたいなソフトがないと対応できなかったり、フォントに奇妙な著作権がくっついていることなんかが原因なんだけど。今年やっている作業からユニコードも使っていいことになった。それはそれで時代の流れかなあとぼんやり思いつつも、問題は共同作業者が同一の文字に対してあるときはユニコード文字、あるときは今昔文字鏡依存みたいな使い方をしているということだ。つまり、what you seeでは同じなんだけど、データ的なwhat you getが同一でない。
これを説明して、きちんと納得してもらうのはものすごく大変なんだよね。それは、データに対する考え方が根本的に違うから。よくwordで作った見栄えの良い印刷文書を、空白が見える設定でデータ分析してみると、スペースなんかで調整したものすごいアナログな手法が見えたりすることがあるじゃないですか。で、バージョンが違ったり互換性のある他のソフトで開くとレイアウト崩れまくり、みたいな(コンピューターに詳しい同僚に言わせれば、あれは悪しき原稿用紙感覚であって、文書作成者には常に見えないマス目があるらしい)。つまり、データそのものと見えている姿の、2つのレイヤーを区別する考え方を理解するまでに一つのハードルがあるわけ。で、そのハードルを越えたところに「見えているのと違うデータが存在しているのはわかるが、いま見えているものの背後にあるデータを手探りで操作するなんて効率的ではない」という、とても大きな断絶があるのね。これを言われてしまうと、ここで起こっているのは異文化接触だぞ、と思ってしまう。
この断絶を無くす努力を共同作業者はするべきなのだろうけれど、この「見えない背後のデータを頭の中で仮定しながら作業する」人と、「見えるデータで作業する」人とは思考の枠組みとしてどちらが優れているというものでもないがゆえに、どちらを取るかは、場や人間関係の力学で決定されてしまう。そしてコードの違いなんて「瑣末」なことは横へ置いておいて、入力作業はサクサク進んでしまうわけ。人と人とは根本的に分かり合えてなくても共同作業ならばするっとできてしまう、ということの証左だなーと思うよ。だからこのエピソードで学べることは、分かり合うような努力をするくらいなら、同じ皿から一緒に飯を食え、ってことだな、といったところで閑話休題。
やっぱりユニコードが扱えるようにTeXの環境づくりからやり直す必要があるんだろう。あ、でも今は今昔文字鏡が使いたいためにwindows環境に出戻りしているけれど、emacsだったらフツーにユニコードに対応してんのかな。どちらにせよ、この原稿を仕上げて、その先の研究会発表を終えてから、なわけだけど。
コメント