Fazer download de livros do Google Books no Linux

É possível utilizar o utilitário pysheng, desenvolvido em Python por Arnau Sanchez para fazer o download de livros do Google books em formato PDF ou um PNG para cada página.

Instalar o pysheng através do terminal:

  1. Descubra a versão atual do pysheng usando o comando:
    w3m -dump http://code.google.com/p/pysheng/downloads/list | grep pysheng- | grep .tgz | awk '{ print $2 }' | head -n 1
  2. Crie um diretório temporário e acesse-o. Você poderá apagá-lo após a instalação. Nele, utilize os comandos (substituindo VERSÃO pelo valor corespondente à versão atual):
    wget http://pysheng.googlecode.com/files/pysheng-VERSÃO.tgz
    tar xvzf pysheng-VERSÃO.tgz
    cd pysheng-VERSÃO
    sudo python setup.py install
  3. Instale o Report Lab:
    apt-get install python-reportlab python-reportlab-accel python-renderpm
  4. Para acessar através da interface gráfica (e fazer o download tanto em PNG quanto em PDF), utilize o comando pysheng-gui. Para baixar todas as páginas em PNG, utilize o comando pysheng <id_do_livro>.

Caso ocorra o erro ValueError: cannot find glade file: main.glade, faça o seguinte:

sudo mkdir /usr/share/pysheng
ln -s /usr/local/share/pysheng/main.glade /usr/share/pysheng/main.glade

Encontrar o id do livro no Google

O código id do livro pode ser obtido no próprio endereço:  http://books.google.com.br/books?id=Gn2cnP0ZFUIC&printsec=frontcover&hl=pt-BR&source=gbs_ge_summary_r&cad=0#v=onepage&q&f=false

Direitos autorais

O Google possui autorização dos autores dos livros no que diz respeito à publicação do conteúdo íntegro ou parcial das obras. O download desses conteúdos e sua reprodução é crime, por isso recomendo que você só faça download de obras que sejam de domínio público (muitas delas disponíveis em http://www.dominiopublico.gov.br/pesquisa/PesquisaObraForm.jsp).