2007年02月20日

言語の壁

ある程度ワールドワイドな企業だと言語の問題は避けて通れないと思います。
と言っても会話の問題じゃないです。自分が言ってるのはエンコードの問題。
意外に何とかなりそうで、いざ問題が発生すると結構面倒。
最近でも幾つかありました。


最初にあったのは中国で開発されたプログラムを日本で解析しようとしたらビルド出来なかったって問題。中国語の部分がダブルコーテーションとかを飲み込んで文字化けしてしまってエラーになるとか。
衝撃的なのは元はShiftJisのコードに中国語(EUC-CN)でコメントを入れてる点。お前らどうやってビルドしてるんだよと問い詰めたい。

仕方がないので2バイト文字は全部同じ文字に変換して対処。
あくまで解析なのでOKでしょう。別に人が動かす訳じゃないし。


次に来たのは日本語と英語にしか対応してないデータベースにドイツ語のインポートファイルで登録してデータをぶっ壊す人が居るから何とかして欲しいと言う話。
今度はデータとして残っちゃうから間違いっぽい文字を全部置き換えると言うごまかしがきかないし!!

調べて見るとドイツ語のエンコード(Latin1)は8bit使いの1バイト文字なので英語とは区別を付けられるらしい。ただ、日本語のような2バイト文字との比較だと日本語であって、ドイツ語ではない事が証明出来ないと言う面倒な状況。

完全に対処するのは不可能だったので0x80以降を使っているファイルに関しては「注意:もし日本語のファイルじゃないないならエラーの可能性があります」と何とも中途半端な警告文を出すことに・・・。


その後来たのは「今度はフランス語で(ry」


ソースコードもデータベースも全部Unicodeにでもして・・・。



lotus_blo at 23:00│Comments(2)TrackBack(0)雑記 | Edit

トラックバックURL

この記事へのコメント

1. Posted by BMW-MHR?   2007年02月22日 17:04
「あ、あるある」と頷くご無沙汰の人。
そんな時の為に素晴らしい言葉を

「English please!」

国内だったら
「日本語でおk」
なんですけどね。(苦笑)

まぁ、私の方はプログラムじゃなくて、文章の多言語化のほうなんですけど。(謎)
2. Posted by ロータス   2007年02月22日 22:02
お久しぶりです。

>English Please
一応そう言う事はやってるんですけど漏れがあるらしいんですよね。
日本で言うとうっかり全角文字入れちゃったみたいな。

>文章の多言語化
やっぱり何処でも多国語対応は面倒なもんなんですねぇ。

この記事にコメントする

名前:
URL:
  情報を記憶: 評価: 顔