New version with the new EPUB converter.
[librarian.git] / src / librarian / text.py
1 # -*- coding: utf-8 -*-
2 #
3 # This file is part of Librarian, licensed under GNU Affero GPLv3 or later.
4 # Copyright © Fundacja Nowoczesna Polska. See NOTICE for more information.
5 #
6 from __future__ import unicode_literals
7
8 import copy
9 from librarian import functions, OutputFile, get_resource
10 from lxml import etree
11 import io
12 import os
13 import six
14
15
16 functions.reg_substitute_entities()
17 functions.reg_wrap_words()
18 functions.reg_strip()
19 functions.reg_person_name()
20
21
22 with io.open(get_resource("res/text/template.txt")) as f:
23     TEMPLATE = f.read()
24
25
26 def transform(wldoc, flags=None, **options):
27     """
28     Transforms input_file in XML to output_file in TXT.
29     possible flags: raw-text,
30     """
31     # Parse XSLT
32     style_filename = os.path.join(os.path.dirname(__file__),
33                                   'xslt/book2txt.xslt')
34     style = etree.parse(style_filename)
35
36     document = copy.deepcopy(wldoc)
37     del wldoc
38     document.swap_endlines()
39
40     if flags:
41         for flag in flags:
42             document.edoc.getroot().set(flag, 'yes')
43     if 'wrapping' in options:
44         options['wrapping'] = str(options['wrapping'])
45
46     result = document.transform(style, **options)
47
48     if not flags or 'raw-text' not in flags:
49         if document.book_info:
50             parsed_dc = document.book_info
51             description = parsed_dc.description
52             url = document.book_info.url
53
54             license_name = parsed_dc.license_description
55             license = parsed_dc.license
56             license_description = [
57                 (
58                     "Wszystkie zasoby Wolnych Lektur możesz swobodnie wykorzystywać, "
59                     "publikować i rozpowszechniać pod warunkiem zachowania warunków "
60                     "licencji i zgodnie z Zasadami wykorzystania Wolnych Lektur."
61                 )
62             ]
63
64             if license:
65                 license_description.append(
66                     "Ten utwór jest udostępniony na licencji %s: %s" % (
67                         license_name, license
68                     )
69                 )
70             else:
71                 license_description.append(
72                     "Ten utwór jest w domenie publicznej."
73                 )
74             license_description.append(
75                 "Wszystkie materiały dodatkowe (przypisy, motywy literackie) są "
76                 "udostępnione na Licencji Wolnej Sztuki 1.3: "
77                 "https://artlibre.org/licence/lal/pl/\n"
78                 "Fundacja Nowoczesna Polska zastrzega sobie prawa do wydania "
79                 "krytycznego zgodnie z art. Art.99(2) Ustawy o prawach autorskich "
80                 "i prawach pokrewnych.\nWykorzystując zasoby z Wolnych Lektur, "
81                 "należy pamiętać o zapisach licencji oraz zasadach, które "
82                 "spisaliśmy w Zasadach wykorzystania Wolnych Lektur: "
83                 "https://wolnelektury.pl/info/zasady-wykorzystania/\nZapoznaj "
84                 "się z nimi, zanim udostępnisz dalej nasze książki"
85             )
86             license_description = "\n".join(license_description)
87
88             source = parsed_dc.source_name
89             if source:
90                 source = "\n\nTekst opracowany na podstawie: " + source
91             else:
92                 source = ''
93
94             contributors = ', '.join(
95                 person.readable()
96                 for person in sorted(set(
97                     p for p in (
98                         parsed_dc.technical_editors + parsed_dc.editors
99                     ) if p))
100             )
101             if contributors:
102                 contributors = (
103                     "\n\nOpracowanie redakcyjne i przypisy: %s."
104                     % contributors
105                 )
106             funders = ', '.join(parsed_dc.funders)
107             if funders:
108                 funders = u"\n\nPublikację wsparli i wsparły: %s." % funders
109             publisher = '\n\nWydawca: ' + ', '.join(parsed_dc.publisher)
110             isbn = getattr(parsed_dc, 'isbn_txt', None)
111             if isbn:
112                 isbn = '\n\n' + isbn
113             else:
114                 isbn = ''
115         else:
116             description = ("Publikacja zrealizowana w ramach projektu "
117                            "Wolne Lektury (http://wolnelektury.pl).")
118             url = '*' * 10
119             license_description = ""
120             source = ""
121             contributors = ""
122             funders = ""
123             publisher = ""
124             isbn = ""
125         result = (TEMPLATE % {
126             'description': description,
127             'url': url,
128             'license_description': license_description,
129             'text': six.text_type(result),
130             'source': source,
131             'contributors': contributors,
132             'funders': funders,
133             'publisher': publisher,
134             'isbn': isbn,
135         }).encode('utf-8')
136     else:
137         result = six.text_type(result).encode('utf-8')
138     return OutputFile.from_bytes(b"\r\n".join(result.splitlines()) + b"\r\n")