トップページ | Python 標準ドキュメント | 事例集 | アーティクル | リンク集 | ダウンロード | サイトマップ 
468x60サイズバナー・シリーズC Simple Fun and Indented
  過去のニュース

これ以上記事はありません。

 
  (旧バージョン)

2002年3月以前のNews

 

 Python News [トップ] |  [投稿] |  [検索] |  [RSS]  | [親発言]

  オンライン・ドキュメント Python本 Python Module 日本Pythonユーザ会 Pythonのうわさ  
  Re: 文字コード判定ライブラリ Universal Encoding Detector
   2006年07月21日(Fri) 09:48PMに ふかまち さんが投稿 
SJIS の環境でちょっと意地悪してみましょう。

import chardet
chardet.detect("これはなに")
chardet.detect("蛇のとぐろを見る")
chardet.detect("東京のこれは何")
chardet.detect("文字列の判定をするのだ")

句読点が含まれない短い文字列を判定させると、こける可能性があります。句読点を含む文字列なら大丈夫だと思いますが。

chardet.detect("。") 
chardet.detect("、")

import pykf
pykf.guess("これはなに")
だとこけないので、短い文字列で日本語の文字列と分かっているなら pykf 等使った方が安全かもしれません。
 
返事を書く

名前
メールアドレス
題名
コメント

(URLをチェック! http://を忘れずに!)
形式

わからなかったら'プレーンテキスト'を選んでください!
添付

(記事の読者がダウンロードできるようにファイルを添付することもできます。
ファイルサイズはできるだけ500kb以下にお願いします)
利用可能なHTMLタグ
<B> <I> <P> <A> <LI> <OL> <UL> <EM> <BR> <TT> <HR> <STRONG> <BLOCKQUOTE> <DIV .*> <DIV> <P .*>
重要事項:
  • 注意:太字のタイトルは必須事項です。
  • トピックカテゴリにあった記事をお願いします。
  • コメントは、新しいスレッドではなく、返事にしてください。
  • すでに同じ発言があるかもしれません。他の記事もよく読んでください。
  • 分かりやすいサブジェクトにしてください。
  • 話題からはずれたり不適当だったり、違法、不愉快、攻撃的なコメントは控えてください。このような投稿を繰り返し、行う人は投稿禁止にします。
  •  
    "へいかのじょ、オラとオブジェクトをついきゅうしない?" -- しんのすけ

    印刷用ページ
    Copyright © 2001-2012 Python Japan User's Group.

    警告当サイトの文書・画像等のコンテンツの著作権は、各コンテンツの作成者、もしくは日本Pythonユーザ会に帰属します。
     また、日本Pythonユーザ会はサイト内のコンテンツに他のプログラミング言語からの乗り換えを誘発する恐れのある表現が多々あることを認め、予めお詫び申し上げます。