025:文字列の長さを得る
「文字列の長さ」と言ったとき、一般的な意味は二つあります。バイト数と文字数です。 バイト数はlen()ででます。文字を数えるときは、unicodeを利用するのがよいと思います。 下の例では、文字列をshift_jisからunicodeに変換しました。 日本語の取り扱いについては、 日本語環境でのPython を見てください。
>>> a='longlongago' >>> len(a) 11 >>> b="昔昔" >>> len(b) 4 >>> c=unicode(b,'shift_jis') >>> c u'\u6614\u6614' >>> len(c) 2 >>> print c 昔昔
文字数を数えるときは
>>> a='He is Papasan' >>> print a.split() ['He', 'is', 'Papasan'] >>> print len(a.split()) 3