add dc:audiences
[librarian.git] / librarian / mobi.py
1 # -*- coding: utf-8 -*-
2 #
3 # This file is part of Librarian, licensed under GNU Affero GPLv3 or later.
4 # Copyright © Fundacja Nowoczesna Polska. See NOTICE for more information.
5 #
6 import os
7 import os.path
8 import subprocess
9 from tempfile import NamedTemporaryFile
10 from lxml import etree
11
12 from librarian.cover import WLCover
13 from librarian import epub, get_resource, NoDublinCore, RDFNS
14 from librarian.dcparser import BookInfo
15
16
17 def transform(provider, slug=None, file_path=None, output_file=None, output_dir=None, make_dir=False, verbose=False,
18               sample=None, cover=None, flags=None):
19     """ produces a MOBI file
20
21     provider: a DocProvider
22     slug: slug of file to process, available by provider
23     output_file: path to output file
24     output_dir: path to directory to save output file to; either this or output_file must be present
25     make_dir: writes output to <output_dir>/<author>/<slug>.mobi instead of <output_dir>/<slug>.mobi
26     sample=n: generate sample e-book (with at least n paragraphs)
27     cover: a cover.Cover object
28     flags: less-advertising,
29     """
30
31     # read metadata from the first file
32     if file_path:
33         if slug:
34             raise ValueError('slug or file_path should be specified, not both')
35         f = open(file_path, 'r')
36         input_xml = etree.parse(f)
37         f.close()
38     else:
39         if not slug:
40             raise ValueError('either slug or file_path should be specified')
41         input_xml = etree.parse(provider[slug])
42
43     metadata = input_xml.find('.//'+RDFNS('Description'))
44     if metadata is None:
45         raise NoDublinCore('Document has no DublinCore - which is required.')
46     book_info = BookInfo.from_element(input_xml)
47
48     # if output to dir, create the file
49     if output_dir is not None:
50         if make_dir:
51             author = unicode(book_info.author)
52             output_dir = os.path.join(output_dir, author)
53             try:
54                 os.makedirs(output_dir)
55             except OSError:
56                 pass
57         if slug:
58             output_file = os.path.join(output_dir, '%s.mobi' % slug)
59         else:
60             output_file = os.path.join(output_dir, os.path.splitext(os.path.basename(file_path))[0] + '.mobi')
61
62     # provide a cover by default
63     if not cover:
64         cover = WLCover
65     cover_file = NamedTemporaryFile(suffix='.png', delete=False)
66     c = cover(book_info.author.readable(), book_info.title)
67     c.save(cover_file)
68
69     epub_file = NamedTemporaryFile(suffix='.epub', delete=False)
70     if not flags:
71         flags = []
72     flags = list(flags) + ['without-fonts']
73     epub.transform(provider, file_path=file_path, output_file=epub_file, verbose=verbose,
74               sample=sample, html_toc=True, flags=flags, style=get_resource('mobi/style.css'))
75
76     if verbose:
77         kwargs = {}
78     else:
79         devnull = open("/dev/null", 'w')
80         kwargs = {"stdout": devnull, "stderr": devnull}
81     subprocess.check_call(['ebook-convert', epub_file.name, output_file,
82             '--no-inline-toc', '--cover=%s' % cover_file.name], **kwargs)
83     os.unlink(epub_file.name)
84     os.unlink(cover_file.name)