home changes contents help options

**022:文字コードを推測する**

Universal Encoding Detectorを使えばできるらしい。

簡易的には次のようにエンコードできる文字コードを総当たりで試していくという方法があるが、割り当てられているコードにダブりがあるので、うまく動かないことも多い。

 def guess_encoding(s):
    encodings=["ascii","utf-8","shift-jis","euc-jp"]
    for enc in encodings:
      try:
        unicode(s,enc)
        break
      except UnicodeDecodeError,e:
        enc=""
    return enc