cdif/sdif でいろんな言語を試してみた / multi language trial
Korean
多分大丈夫だろうと思ってはいたが、韓国語はなんの問題もなく処理できる。
As expected, Korean is fine.
Chinese
中国語は、案の定漢字の連続を一単語として処理すると塩梅が悪い。 -B オプションをつけるとうまく行っているような気がする。
Chinese works ok with -B option for cdif.
Arabic
よもやと思ってアラビア語をやってみた。
Arabic doesn't work.
やっぱり駄目だったか...
そもそも、どうしてアラビア語の部分だけではなくて全体が左右反転してしまうのかとか、まったくメカニズムがわからない。
ちなみに、アラビア語はサンプルがみつからなかったので、雪国の冒頭部分の日本語と英訳を Google で翻訳したものである。