X-Git-Url: https://git.mdrn.pl/wolnelektury.git/blobdiff_plain/f8228cc6712f9a71f877b0ea60719c256519f16e..ca7f934164aa070cd408bfcf0b4246acd980bd8b:/lib/librarian/bin/book2txt.py?ds=sidebyside
diff --git a/lib/librarian/bin/book2txt.py b/lib/librarian/bin/book2txt.py
index 413ff674b..4ad787941 100755
--- a/lib/librarian/bin/book2txt.py
+++ b/lib/librarian/bin/book2txt.py
@@ -6,6 +6,16 @@ import optparse
import codecs
+HEADER = u"""
+-----
+Publikacja zrealizowana w ramach projektu Wolne Lektury (http://wolnelektury.pl/). Reprodukcja cyfrowa wykonana przez BibliotekÄ NarodowÄ
z egzemplarza pochodzÄ
cego ze zbiorów BN.
+Ten utwór nie jest chroniony prawem autorskim i znajduje siÄ w domenie publicznej, co oznacza, że możesz go swobodnie wykorzystywaÄ, publikowaÄ i rozpowszechniaÄ.
+ŹródÅo:
+-----
+
+"""
+
+
REGEXES = [
(r'
(.|\n)*?
', ''), (r'<[^>]+>', ''), - (r'/\n', ''), + (r'/\n', '\n'), (r'---', u'â'), (r'--', u'-'), (r',,', u'â'), @@ -50,7 +60,8 @@ if __name__ == '__main__': # print pattern, repl xml, n = re.subn(pattern, repl, xml) # print n - + output = codecs.open(output_filename, 'w', encoding='utf-8') + output.write(HEADER) output.write(xml)