librarian/mobi.py

   1 # -*- coding: utf-8 -*-
   2 #
   3 # This file is part of Librarian, licensed under GNU Affero GPLv3 or later.
   4 # Copyright © Fundacja Nowoczesna Polska. See NOTICE for more information.
   5 #
   6 import os
   7 import os.path
   8 import subprocess
   9 from tempfile import NamedTemporaryFile
  10 from lxml import etree
  11
  12 from librarian.cover import WLCover
  13 from librarian import epub, get_resource, NoDublinCore, RDFNS
  14 from librarian.dcparser import BookInfo
  15
  16
  17 def transform(provider, slug=None, file_path=None, output_file=None, output_dir=None, make_dir=False, verbose=False,
  18               sample=None, cover=None, flags=None):
  19     """ produces a MOBI file
  20
  21     provider: a DocProvider
  22     slug: slug of file to process, available by provider
  23     output_file: path to output file
  24     output_dir: path to directory to save output file to; either this or output_file must be present
  25     make_dir: writes output to <output_dir>/<author>/<slug>.mobi instead of <output_dir>/<slug>.mobi
  26     sample=n: generate sample e-book (with at least n paragraphs)
  27     cover: a cover.Cover object
  28     flags: less-advertising,
  29     """
  30
  31     # read metadata from the first file
  32     if file_path:
  33         if slug:
  34             raise ValueError('slug or file_path should be specified, not both')
  35         f = open(file_path, 'r')
  36         input_xml = etree.parse(f)
  37         f.close()
  38     else:
  39         if not slug:
  40             raise ValueError('either slug or file_path should be specified')
  41         input_xml = etree.parse(provider[slug])
  42
  43     metadata = input_xml.find('.//'+RDFNS('Description'))
  44     if metadata is None:
  45         raise NoDublinCore('Document has no DublinCore - which is required.')
  46     book_info = BookInfo.from_element(input_xml)
  47
  48     # if output to dir, create the file
  49     if output_dir is not None:
  50         if make_dir:
  51             author = unicode(book_info.author)
  52             output_dir = os.path.join(output_dir, author)
  53             try:
  54                 os.makedirs(output_dir)
  55             except OSError:
  56                 pass
  57         if slug:
  58             output_file = os.path.join(output_dir, '%s.mobi' % slug)
  59         else:
  60             output_file = os.path.join(output_dir, os.path.splitext(os.path.basename(file_path))[0] + '.mobi')
  61
  62     # provide a cover by default
  63     if not cover:
  64         cover = WLCover
  65     cover_file = NamedTemporaryFile(suffix='.png', delete=False)
  66     c = cover(book_info.author.readable(), book_info.title)
  67     c.save(cover_file)
  68
  69     epub_file = NamedTemporaryFile(suffix='.epub', delete=False)
  70     if not flags:
  71         flags = []
  72     flags = list(flags) + ['without-fonts']
  73     epub.transform(provider, file_path=file_path, output_file=epub_file, verbose=verbose,
  74               sample=sample, html_toc=True, flags=flags, style=get_resource('mobi/style.css'))
  75
  76     if verbose:
  77         kwargs = {}
  78     else:
  79         devnull = open("/dev/null", 'w')
  80         kwargs = {"stdout": devnull, "stderr": devnull}
  81     subprocess.check_call(['ebook-convert', epub_file.name, output_file,
  82             '--no-inline-toc', '--cover=%s' % cover_file.name], **kwargs)
  83     os.unlink(epub_file.name)
  84     os.unlink(cover_file.name)