src/librarian/fb2.py

   1 # This file is part of Librarian, licensed under GNU Affero GPLv3 or later.
   2 # Copyright © Fundacja Wolne Lektury. See NOTICE for more information.
   3 #
   4 import os.path
   5 from copy import deepcopy
   6 from lxml import etree
   7
   8 from librarian import functions, OutputFile
   9 from .epub import replace_by_verse
  10
  11
  12 functions.reg_substitute_entities()
  13 functions.reg_person_name()
  14
  15
  16 def sectionify(tree):
  17     """Finds section headers and adds a tree of _section tags."""
  18     sections = [
  19         'naglowek_czesc',
  20         'naglowek_akt', 'naglowek_rozdzial', 'naglowek_scena',
  21         'naglowek_podrozdzial']
  22     section_level = dict((v, k) for (k, v) in enumerate(sections))
  23
  24     # We can assume there are just subelements an no text at section level.
  25     for level, section_name in reversed(list(enumerate(sections))):
  26         for header in tree.findall('//' + section_name):
  27             section = header.makeelement("_section")
  28             header.addprevious(section)
  29             section.append(header)
  30             sibling = section.getnext()
  31             while (sibling is not None and
  32                     section_level.get(sibling.tag, 1000) > level):
  33                 section.append(sibling)
  34                 sibling = section.getnext()
  35
  36
  37 def transform(wldoc, verbose=False,
  38               cover=None, flags=None):
  39     """ produces a FB2 file
  40
  41     cover: a cover.Cover object or True for default
  42     flags: less-advertising, working-copy
  43     """
  44
  45     document = deepcopy(wldoc)
  46     del wldoc
  47
  48     if flags:
  49         for flag in flags:
  50             document.edoc.getroot().set(flag, 'yes')
  51
  52     document.clean_ed_note()
  53     document.clean_ed_note('abstrakt')
  54
  55     style_filename = os.path.join(os.path.dirname(__file__), 'fb2/fb2.xslt')
  56     style = etree.parse(style_filename)
  57
  58     replace_by_verse(document.edoc)
  59     sectionify(document.edoc)
  60
  61     result = document.transform(style)
  62
  63     return OutputFile.from_bytes(str(result).encode('utf-8'))
  64
  65 # vim:et