cdif/sdif でいろんな言語を試してみた / multi language trial

Korean

多分大丈夫だろうと思ってはいたが、韓国語はなんの問題もなく処理できる。

As expected, Korean is fine.

f:id:uta46:20140131140507p:plain

Chinese

中国語は、案の定漢字の連続を一単語として処理すると塩梅が悪い。 -B オプションをつけるとうまく行っているような気がする。

Chinese works ok with -B option for cdif.

f:id:uta46:20140131140630p:plain

Arabic

よもやと思ってアラビア語をやってみた。

Arabic doesn't work.

f:id:uta46:20140131140858p:plain

やっぱり駄目だったか...

そもそも、どうしてアラビア語の部分だけではなくて全体が左右反転してしまうのかとか、まったくメカニズムがわからない。

ちなみに、アラビア語はサンプルがみつからなかったので、雪国の冒頭部分の日本語と英訳を Google で翻訳したものである。