Personal tools
You are here: Home Lights on Zope 青空文庫で特定の著者のZipファイルのURLリストを得て、Kindle 用PDF変換の前準備をするpythonスクリプト
« June 2017 »
Su Mo Tu We Th Fr Sa
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30  
Recent entries
Python Anywhere seko 2016-11-19
帯状疱疹 seko 2016-11-18
Chromebook購入 seko 2016-11-03
マカロニさん めざせデータサイエンティスト seko 2016-11-02
脳波計muse 購入 seko 2016-09-04
フェルデンクライスメソッド227回目  seko 2016-08-27
EXCELマクロ タスクが残っていてTypeNameとShell.Applicationを使って起動済みのIEが探せない seko 2016-04-19
pythonでNITE 化学物質総合情報提供システムへアクセス seko 2016-04-19
Raspberry Pi 3で侵入者を発見 seko 2016-04-03
Raspberry Pi 3 OSのインストール seko 2016-04-02
Docker コンテナをexportするpythonスクリプト seko 2016-03-31
Effective Python ―Pythonプログラムを改良する59項目 seko 2016-03-30
確かな力が身につくPython「超」入門 鎌田 正浩 (著) seko 2016-03-29
pythonでバブルソート seko 2016-03-24
Recent comments
Nella sua apparente purchasing affordable auto insurance Wisconsin 2017-06-08
Só um pequeno escla aouto insurnce Michigan 2017-06-07
J'ai lu appareme land rover defender SD auto insurance 2017-06-07
Mimo, że więks Dallas, Texas car insurance to purchase 2017-06-07
Du har helt ret, men auto owners insurance Oshkosh WI 2017-06-04
I simply want to say car insurance quotes Plainwell MI 2017-06-04
Ερί&sig no down payment car insurance in Tacoma WA 2017-06-04
Marcos Eduardo Neves auto insurance Irmo SC 2017-06-03
Незна full coverage auto insurance Peoria IL 2017-06-03
J'adore ! C' full coverage car insurance Branson MO 2017-06-03
Ciao Luca, a costo d auto insurance rates Russellville AR 2017-06-03
La question qui rest direct auto insurance Glenside PA 2017-06-03
Uooooooo!!! Jo lu de auto insurance rates Gretna LA 2017-06-03
Tolle Bilder! Deine auto insurance Parkville MD 2017-06-03
Recent trackbacks
ブランドコピー激安 ブランドコピー激安 2017-06-23
ブランドコピー激安 ブランドコピー激安 2017-06-23
ブランド スーパーコピー ブランド スーパーコピー 2017-06-23
ブランド スーパーコピー ブランド スーパーコピー 2017-06-23
ブランド スーパーコピー ブランド スーパーコピー 2017-06-23
偽物 偽物 2017-06-22
ブランド激安 キーケース emoda ブランド激安 キーケース emoda 2017-06-19
カルティエ 結婚指輪 文字数 カルティエ 結婚指輪 文字数 2017-05-08
オメガ 一覧 オメガ 一覧 2017-05-06
『必笑小咄のテクニック』 米原万里 じゅうのblog 2016-04-26
まんが 哲学入門 天竺堂の本棚 2014-02-24
史上最強の哲学入門 東洋の哲人たち 天竺堂の本棚 2014-02-19
「本屋さんで待ち合わせ」三浦しをん 粋な提案 2013-10-01
PythonでCPUの数を調べる。 ヲドリテヒヅル 2012-12-03
 
Document Actions

青空文庫で特定の著者のZipファイルのURLリストを得て、Kindle 用PDF変換の前準備をするpythonスクリプト

by seko posted at 2009-12-07 18:54 last modified 2009-12-07 19:09

昨日は、青空キンドル(仮)のサイト を使わせていただいて、岡本綺堂の半七捕物帖の第一話である「お文の魂」をPDFに変換し、Kindleで読んでみました。

でも、岡本綺堂の作品 は226個もあります。

ここは著者を選べば、その作品すべてがPDF化されて、Kindleに転送されるのがよいなと思います。

次のような手順になるでしょうか。

  • 著者のURLから、すべての図書カードのリストを作る
  • 図書カードのリストからzipファイルのurlリストを得る
  • 青空キンドル(仮)のサイト にzipのURLを渡して、PDFをダウンロードする(やったことないです)
  • 著者の名前や書名をローマ字に変換して、PDFのファイル名を著者+書名に変更する(できるんでしょうか?)
  • KindleのdocumentsフォルダーにPDFを転送して、完了したらデバイスを取り外す

とりあえず、一番目と二番目を行うpythonスクリプトを書いてみました。プログラムを書くのは一年ぶりのような気がします。

    # -*- encoding: utf-8 -*-
    #-------------------------------------------------------------------------------
    # Name:        aozoralst.py
    # Purpose:     青空文庫で著者のURLを指定すると、公開されている図書カードを見つけ
    #       て、zipファイルのリストを得る
    # Author:      seko
    #
    # Created:     07/12/2009
    # Copyright:   (c) seko 2009
    # Licence:     ご自由に
    #-------------------------------------------------------------------------------
    #!/usr/bin/env python

    import urllib2
    import re
    import urlparse

    def get_booklist(url):
        """
        青空文庫の著者のURLを指定して、図書カードのURLのリストを得る
        """
        booklist=[]
        for line in urllib2.urlopen(url):
            s = unicode(line, 'euc-jp')
            m=re.search('a href="(\S*cards/\S*.html)',s)
            try:
                booklist.append (m.group(1))
            except:
                pass
        book_url=[]
        for book in booklist:
            book_url.append ( urlparse.urljoin (url,book))
        return book_url

    def get_zip_url(url):
        """
        図書カードからzipファイルのURLを得る。複数個の場合あり(ルビの有無など)
        """
        ziplist=[]
        for line in urllib2.urlopen(url):
            s = unicode(line, 'euc-jp')
            m=re.search('a href="(\S*.zip)"',s)
            try:
                ziplist.append(urlparse.urljoin(url, (m.group(1))))
            except:
                pass
        return ziplist

    ### main ###

    #岡本綺堂のページ
    url="http://www.aozora.gr.jp/index_pages/person82.html"

    for book in get_booklist(url):
        print book

    #get_zip_url("http://www.aozora.gr.jp/cards/000082/card49564.html")
    for book in get_booklist(url):
        for zip in get_zip_url(book):
            print zip

結果

図書カードのリスト :

 http://www.aozora.gr.jp/cards/000082/card49564.html
 http://www.aozora.gr.jp/cards/000082/card45478.html
 http://www.aozora.gr.jp/cards/000082/card45500.html
 http://www.aozora.gr.jp/cards/000082/card43042.html
 http://www.aozora.gr.jp/cards/000082/card49562.html

zipのリスト :

 http://www.aozora.gr.jp/cards/000082/files/49564_ruby_33587.zip
 http://www.aozora.gr.jp/cards/000082/files/45478_ruby_24508.zip
 http://www.aozora.gr.jp/cards/000082/files/45500_ruby_23134.zip
 http://www.aozora.gr.jp/cards/000082/files/43042_ruby_16085.zip
 http://www.aozora.gr.jp/cards/000082/files/49562_ruby_33588.zip
 http://www.aozora.gr.jp/cards/000082/files/49561_ruby_33578.zip

The URL to Trackback this entry is:
http://lightson.dip.jp/blog/seko/2148/tbping

カルティエ 結婚指輪 文字数

Posted by カルティエ 結婚指輪 文字数 at 2017-05-08 19:44
ルイヴィトンコピー品第1店 販売専門店 ★真のS品N品コピー品質をお届けするルイヴィトンブランドコピー! ※価値あるブランドS品N品コピー財布、バッグのヴィトンコピー※ ■品質重視なブランドコピー商品販売! ★高級品☆┃時計┃バッグ┃財 布┃その他┃ ◆★ 誠実★信用★顧客は至上 ●在庫情報随時更新! 品質がよい 価格が低い 実物写真 品質を重視 100%品質保証 100%満足保障 信用第一 ★人気最新品┃特恵中┃☆腕時計、バッグ、財布、ベルト、靴、帽子、アクセサリー、小物☆ ★当店商品送料無料日本全国! ※全物品激安,到着するのは迅速で、安全。 ■あなたの訪問のを期待しています!☆ヽ(▽⌒)
Add comment

You can add a comment by filling out the form below. Plain text formatting.

(Required)
(Required)
(Required)


Powered by Plone, the Open Source Content Management System

This site conforms to the following standards: