|
文字コード判定ライブラリ Universal Encoding Detector
|
yimado による 2006年03月30日(Thu) 12:18AM の投稿
Universal Encoding Detector は Mozillaのコードが移植された、文字コードを判定するライブラリです。
とりあえずの使い方はとっても簡単で文字(列)をdetect()するだけで、推定されたエンコーディングと信頼度が返ってきます。
サポートされている文字コードも文句ありません。
「あ」1文字のように入力文字列が短すぎる場合の判定は常に信頼度0.505と出てましたがエンコーディングは合っていました。実用では1文字から推定するなんて皆無なので何も心配することはないでしょう。
重要事項:
注意:太字のタイトルは必須事項です。
トピックカテゴリにあった記事をお願いします。
コメントは、新しいスレッドではなく、返事にしてください。
すでに同じ発言があるかもしれません。他の記事もよく読んでください。
分かりやすいサブジェクトにしてください。
話題からはずれたり不適当だったり、違法、不愉快、攻撃的なコメントは控えてください。このような投稿を繰り返し、行う人は投稿禁止にします。
|