スキップしてメイン コンテンツに移動

「こばとの じゅばんん ともて だじい」では意外に読めず

ねとらぼ:確かに“読めてしまう”コピペに2ch住人が「人間すげー」と驚く - ITmedia News。あはは、これすごいな。語頭情報が重要であるということは言語学的にはすでに良く知られている。けれど、こうやって文章を読めてしまう現実はやっぱり「人間すげー」です。

こんちには みさなん おんげき ですか? わしたは げんき です。
この ぶんょしう は いりぎす の ケブンッリジ だがいく の けゅきんう の けっか
にんんげ は もじ を にしんき する とき その さしいょ と さいご の もさじえ あいてっれば
じばんゅん は めくちちゃゃ でも ちんゃと よめる という けゅきんう に もづいとて
わざと もじの じんばゅん を いかれえて あまりす。
どでうす? ちんゃと よゃちめう でしょ?
ちんゃと よためら はのんう よしろく


「こばとの じゅばんん ともて だじい」が読みにくいのは、4文字語もしくは助詞込み4文字以上なら音転倒があってもイケルけど、3文字語以下だと厳しいということでしょうね。語の長さが語の識別性を保証している、ということも言語学的によく知られたこと。すなわち、
語の長さによる識別性>音転倒による非識別性
となったときに、「読めちゃう」現象がおこるだのとおわもれる。

(追記)
つまり「文字の順番が入れ替わっている」「最初と最後があっている」条件を満たすのは、最低4文字必要ということ。元記事では最後の文字も固定でしたが、見落としていました。

* * * * *

たとえばこの話は、小松英雄『古典再入門 『土佐日記』を入りぐちにして』(→amazon)での主張、すなわち土佐日記の「をとこもすなる日記」に「をとこもじ(男文字)」が隠れていることの蓋然性を高める根拠ともなるだろう(
niji wo mita: 古典再入門―『土佐日記』を入りぐちにして)。

コメント

ex同僚 さんのコメント…
元ネタはこれらしいですね。こういうのって日本語と英語との差異とかには全然関係ないんですか?言語の生得/普遍的な部分なのかな?

Aoccdrnig to a rscheearch at Cmabrigde Uinervtisy,

it deosn't mttaer in waht oredr the ltteers in a wrod are,

the olny iprmoetnt tihng is taht the frist

and lsat ltteer be at the rghit pclae. The rset can be

a toatl mses and you can sitll raed it

wouthit porbelm. Tihs is bcuseae the huamn mnid deos not

raed ervey lteter by istlef, but the wrod as a wlohe.
NJM さんの投稿…
書かれた言葉についての研究についてはあまり読んだことがないのですが、口頭言語については、参考になりそうな議論はあります。

日本語と英語のリズム単位が、拍か音節かというのが発端で、「両者はリズム単位が違うように見えていたのが実は見方を変えれば同じ」、もう百歩進んで普遍的な部分があるのではないか云々の話です。つまり、語の認識に必要な(聴覚上・視覚上)長さを切り詰めて行ったときに、これ以上切れない長さ、というのが諸言語に共通しているのではないかという議論でした。参考になんのかなこれ。

ただ、日本語に限って言えば、少なくとも古代語と現代語では、語の意味を保証する長さに違いがあると思っています。古代語では「背(せ)」「目(め)」のように、基本的には単音節語が基礎語彙をなしているのに対し、現代語では「背中」「まなこ」などのように多音節語が基礎語彙をなしているので(その分複雑なアクセントシステムで同音語の識別を行っていたはず)、現代語のほうが語の意味を保証する長さは長いのではないかと思います。

ともあれ、最初と最後を認識することで、全体を精査せずに済んでいる、という認識の経済性自体は生物レベル=生得的な話くさいなと思います。