home changes contents help options

025:文字列の長さを得る

「文字列の長さ」と言ったとき、一般的な意味は二つあります。バイト数と文字数です。 バイト数はlen()ででます。文字を数えるときは、unicodeを利用するのがよいと思います。 下の例では、文字列をshift_jisからunicodeに変換しました。 日本語の取り扱いについては、 日本語環境でのPython を見てください。

 >>> a='longlongago'
 >>> len(a)
 11
 >>> b="昔昔"
 >>> len(b)
 4
 >>> c=unicode(b,'shift_jis')
 >>> c
 u'\u6614\u6614'
 >>> len(c)
 2
 >>> print c
 昔昔

文字数を数えるときは

 >>> a='He is Papasan'
 >>> print a.split()
 ['He', 'is', 'Papasan']
 >>> print len(a.split())
 3