X-Git-Url: https://git.mdrn.pl/wolnelektury.git/blobdiff_plain/43b0d0350b82618ba9e46a8f71090211a596a1af..e6e2a0c15e0c3910e1a89cf3f96d4f768c6888d9:/lib/librarian/bin/book2txt.py?ds=sidebyside
diff --git a/lib/librarian/bin/book2txt.py b/lib/librarian/bin/book2txt.py
index 84a8f4084..9c470805e 100755
--- a/lib/librarian/bin/book2txt.py
+++ b/lib/librarian/bin/book2txt.py
@@ -6,6 +6,17 @@ import optparse
import codecs
+HEADER = u"""\
+Kodowanie znaków w dokumencie: UTF-8.
+-----
+Publikacja zrealizowana w ramach projektu Wolne Lektury (http://wolnelektury.pl/). Reprodukcja cyfrowa wykonana przez
+BibliotekÄ NarodowÄ
z egzemplarza pochodzÄ
cego ze zbiorów BN. Ten utwór nie jest chroniony prawem autorskim i znajduje
+siÄ w domenie publicznej, co oznacza, że możesz go swobodnie wykorzystywaÄ, publikowaÄ i rozpowszechniaÄ.
+-----
+
+"""
+
+
REGEXES = [
(r']*>(.|\n)*?', ''),
(r']*>(.|\n)*?', ''),
@@ -50,7 +61,8 @@ if __name__ == '__main__':
# print pattern, repl
xml, n = re.subn(pattern, repl, xml)
# print n
-
+
output = codecs.open(output_filename, 'w', encoding='utf-8')
+ output.write(HEADER)
output.write(xml)