books
Up one level聖書の名画はなぜこんなに面白いのか 井出 洋一郎 (著)
- Category(s)
- books
- The URL to Trackback this entry is:
- http://lightson.dip.jp/blog/seko/2582/tbping
マカロニさん 友達に本をあげるの巻
- Category(s)
- books
- The URL to Trackback this entry is:
- http://lightson.dip.jp/blog/seko/2519/tbping
青空文庫で特定の著者のZipファイルのURLリストを得て、Kindle 用PDF変換の前準備をするpythonスクリプト
昨日は、青空キンドル(仮)のサイト を使わせていただいて、岡本綺堂の半七捕物帖の第一話である「お文の魂」をPDFに変換し、Kindleで読んでみました。
でも、岡本綺堂の作品 は226個もあります。
ここは著者を選べば、その作品すべてがPDF化されて、Kindleに転送されるのがよいなと思います。
次のような手順になるでしょうか。
- 著者のURLから、すべての図書カードのリストを作る
- 図書カードのリストからzipファイルのurlリストを得る
- 青空キンドル(仮)のサイト にzipのURLを渡して、PDFをダウンロードする(やったことないです)
- 著者の名前や書名をローマ字に変換して、PDFのファイル名を著者+書名に変更する(できるんでしょうか?)
- KindleのdocumentsフォルダーにPDFを転送して、完了したらデバイスを取り外す
とりあえず、一番目と二番目を行うpythonスクリプトを書いてみました。プログラムを書くのは一年ぶりのような気がします。
# -*- encoding: utf-8 -*-
#-------------------------------------------------------------------------------
# Name: aozoralst.py
# Purpose: 青空文庫で著者のURLを指定すると、公開されている図書カードを見つけ
# て、zipファイルのリストを得る
# Author: seko
#
# Created: 07/12/2009
# Copyright: (c) seko 2009
# Licence: ご自由に
#-------------------------------------------------------------------------------
#!/usr/bin/env python
import urllib2
import re
import urlparse
def get_booklist(url):
"""
青空文庫の著者のURLを指定して、図書カードのURLのリストを得る
"""
booklist=[]
for line in urllib2.urlopen(url):
s = unicode(line, 'euc-jp')
m=re.search('a href="(\S*cards/\S*.html)',s)
try:
booklist.append (m.group(1))
except:
pass
book_url=[]
for book in booklist:
book_url.append ( urlparse.urljoin (url,book))
return book_url
def get_zip_url(url):
"""
図書カードからzipファイルのURLを得る。複数個の場合あり(ルビの有無など)
"""
ziplist=[]
for line in urllib2.urlopen(url):
s = unicode(line, 'euc-jp')
m=re.search('a href="(\S*.zip)"',s)
try:
ziplist.append(urlparse.urljoin(url, (m.group(1))))
except:
pass
return ziplist
### main ###
#岡本綺堂のページ
url="http://www.aozora.gr.jp/index_pages/person82.html"
for book in get_booklist(url):
print book
#get_zip_url("http://www.aozora.gr.jp/cards/000082/card49564.html")
for book in get_booklist(url):
for zip in get_zip_url(book):
print zip
結果
図書カードのリスト :
http://www.aozora.gr.jp/cards/000082/card49564.html http://www.aozora.gr.jp/cards/000082/card45478.html http://www.aozora.gr.jp/cards/000082/card45500.html http://www.aozora.gr.jp/cards/000082/card43042.html http://www.aozora.gr.jp/cards/000082/card49562.html
zipのリスト :
http://www.aozora.gr.jp/cards/000082/files/49564_ruby_33587.zip http://www.aozora.gr.jp/cards/000082/files/45478_ruby_24508.zip http://www.aozora.gr.jp/cards/000082/files/45500_ruby_23134.zip http://www.aozora.gr.jp/cards/000082/files/43042_ruby_16085.zip http://www.aozora.gr.jp/cards/000082/files/49562_ruby_33588.zip http://www.aozora.gr.jp/cards/000082/files/49561_ruby_33578.zip
- The URL to Trackback this entry is:
- http://lightson.dip.jp/blog/seko/2148/tbping
Python クックブック 第2版
訳者の前書きには次のように書かれています。
最初の行と最後の行の力強さに痺れます。
私もまったく同じ考えで、python recipe bookを書きはじめました。
pythonは入門する必要がない。使ってみたいとき、使ってみたい分野で、使ってみればいいのだ。読む必要があるのはサンプルコードだ。
本はあまりいらない。(リファレンスは不可欠なこともある。)
Pythonは言語仕様がとても小さいので、公式のオンラインドキュメントにあるチュートリアルさえ済んでしまえば、もう小さなコードは容易に
読めるようになってしまう。Pythonで「大きな部分」にあたるのは膨大なモジュールだが、これは各モジュールのドキュメントや、ソース
コードを読むのが手っ取り早い。だから普通の意味での入門書がいらない。あとは書きたいようなコードのサンプルを探してよめばよい。
中略
この言語はインデントで論理が決まることばかりが有名だが、インデントを論理に踏み込ませたことには、もちろんもっと大きな意味がある。
読みやすくすることだ。読みやすさこそ何にも勝るpythonの特徴なのである。どこどこで使われているとか、何々の機能が実現されているとか
、あらゆるプログラミングスタイルに対するサポートがある、といったことは重要だが重要じゃない。
読みやすさこそが重要なのだ。動作可能な疑似コードとはpythonのことだ。
さきほどまで、EXCELに不定型に入力されたデータをデータベースに取り込むための変換プログラムを書いていました。
本来はデータの標準化を先にするべきなのですが、それができないときには、不適切なデータを使いこなして成果を出すことが必要です。成果が出ることが分かれば、スムーズな運用をするための標準化には協力してもらえます。
そのためには、まずはどんな不細工なデータであっても、利用できる形に変換しなくてはなりません。
それにはpythonがぴったりです。似たようなコードがあれば、不細工なデータが30分もかからずにきれいなフォーマットに変わります。(私は基本的なことを思い出すのに6時間くらいかかりますが。。。)
プログラムを職業とする人なら、どんな言語でもこうしたことはできると思いますが、真剣に対応してくれたためしがありません。
問題は本当に困っている人間にしか解決できません。
プログラマでなくても解決するしかないのです。
そして、pyothonならそれができるのです。
PapasanがPerlで行っているスレッドの処理をpythonでできないかを調査するために購入したのですが、そもそもスレッドって何か分かっていません。
この本はWEB上にあるpython cook bookを本にしたものなのですが、それにしてもデジャブのように見たことがあるプログラムばかりです。。。
ま、まさか。。
「隊長大変です。python cook book 英語版を後ろの本棚で発見しました。」
「それはちょうどいい。翻訳の勉強をしようと思っていたんだ。」
- The URL to Trackback this entry is:
- http://lightson.dip.jp/blog/seko/1323/tbping
中島 義道 (著) 悪について
根本悪とは卑劣極まる・血の凍るような・人間業とは思えない極限的悪行のことではない。
それは、信用を得るために人を援助するとか、けちと思われたくないから寄付をするとか、他人を傷つけたくないため真実を伝えないという些細な行為のうちに巣くっている。
それは我々が、自他の幸福を求めようとする限り、必然的に陥る罠なのであり、あらゆる行為の「根っこ」なのである。
根本悪のもとにあるからこそ、われわれは道徳的でありえるのだ。我々には絶対的に「正しい」解答が与えられないと知っているからこそ、それを求め続けるのである。
- Category(s)
- books
- The URL to Trackback this entry is:
- http://lightson.dip.jp/blog/seko/393/tbping
ダレル・ハフ 統計でウソをつく方法
ダレル・ハフ (著), 統計でウソをつく方法
ブルーバックスに入っている1968年の本。
ここで使われているテクニックは、今でも日常的にかつ頻繁に目にするものである。
そして、ほとんどの人がだまされている。
基本中の基本としては、意味のない平均値がある。
100人のうち、お金持ちが二人、貧乏人が98人いたときに、平均を取れば中流という答えが出てくる。
タバコをすう人間は馬鹿になるという調査もある。
これは、タバコを吸うことと学校の成績が悪いということに相関があるという調査に基づいている。
人間には、二つのことが同時に起こると、それを原因と結果で捉えてしまう傾向がある。
ここでは、喫煙が成績の悪さの原因になっていると疑いもなく仮定しているわけだ
でも、原因と結果が逆で、成績が悪いから、憂さ晴らしにタバコをすっているということも考えられる。
最もありそうなのは、喫煙も成績の悪さも、別の原因の結果ということである。
付き合いのよい学生のほうが、喫煙率が高い。外交的な人のほうが、成績は悪いなど。
このように一見筋の通った複数の解釈が可能なとき、人はそれぞれ自分が見たいと思っている物語を選んで、それを現実とするのだ。
- Category(s)
- books
- The URL to Trackback this entry is:
- http://lightson.dip.jp/blog/seko/390/tbping
渋井 哲也 (著) 「出会い系サイトと若者たち 」
出会い系メディアの変遷から、それを利用する若者達からの聞き取り調査、出会い系が生んだ事件のいろいろ、出会い系サイトの期性の問題点までを一通りのことがまとめられていて、読んでいてなるほどと思う。
でも、読み終わった後、伝わってくるものがない。
この本はそういう本でいいのかもしれない。
仮に出会い系サイトを利用する人の心の闇に焦点をあてたとしても、解明できそうに無いし、そもそも闇って何だという話で、収集がつかなくなるような気もするから。
- Category(s)
- books
- The URL to Trackback this entry is:
- http://lightson.dip.jp/blog/seko/388/tbping
いしい しんじ (著) 「ぶらんこ乗り」
いしい しんじ (著) 「ぶらんこ乗り」
最初のうちはなんだかよく分らないが、だんだん物語りに引き込まれていく。
姉思いの弟の姿にうたれる。
デニーズで読んでいたので、涙を隠すのに苦労した。
- Category(s)
- books
- The URL to Trackback this entry is:
- http://lightson.dip.jp/blog/seko/385/tbping
保阪 正康 (著) 「あの戦争は何だったのか―大人のための歴史教科書」
日本軍の組織の説明からはじまり、開戦にいたるターニングポイント、開戦から泥沼へ、敗戦、シベリア抑留までの実態を教えてくれます。
本の中では、NHKの不祥事は、この戦争と同じような構造になっていることが指摘されていますが、三菱自動車やカネボウも同じですね。
戦略や理念を問うことはせず、ひたすら戦術にまい進し、ほころびにつぎをあてるだけ。
そのためには、事実も隠蔽し、都合のよい発表に置き換える。
現実を直視せず、希望や願望を、さも事実であるかのように思い込んでいく。
郵政民営化のごたごたも同じような構造かもしれません。
多くの人に読んでいただきたい本です。
- Category(s)
- books
- The URL to Trackback this entry is:
- http://lightson.dip.jp/blog/seko/384/tbping
あの戦争は何だったのか
正高 信男 (著) 「考えないヒト - ケータイ依存で退化した日本人 」
帯には、「霊長類研究の蓄積から生まれた画期的文明、文化論とある。」
しかし著者は、はじめにで「一連の推測がまったく見当はずれである可能性もあるが、趣味でやっているなら的外れであっても益にはならなくても、さして害になることはないだろうと執筆をきめた」と書く。
それなら帯にもそう書いてほしい。
内容は、著者の作った物語であり、霊長類研究の蓄積が背景にあるとは思われない。
作者と出版社には害がないかもしれないが、お金を払って本を購入し、時間を使った読者には害がないといえるのだろうか?
- Category(s)
- books
- The URL to Trackback this entry is:
- http://lightson.dip.jp/blog/seko/383/tbping
それらしいお手本スクリプトを発見しましたので隊長にお知らせします。
Classとアンダースコア変数が出てくると分からなくなります。