X-Git-Url: https://git.mdrn.pl/wolnelektury.git/blobdiff_plain/43b0d0350b82618ba9e46a8f71090211a596a1af..99fae6026dce1818039c09e3ea0123831e1753e0:/lib/librarian/bin/book2txt.py diff --git a/lib/librarian/bin/book2txt.py b/lib/librarian/bin/book2txt.py index 84a8f4084..9c470805e 100755 --- a/lib/librarian/bin/book2txt.py +++ b/lib/librarian/bin/book2txt.py @@ -6,6 +6,17 @@ import optparse import codecs +HEADER = u"""\ +Kodowanie znaków w dokumencie: UTF-8. +----- +Publikacja zrealizowana w ramach projektu Wolne Lektury (http://wolnelektury.pl/). Reprodukcja cyfrowa wykonana przez +BibliotekÄ NarodowÄ z egzemplarza pochodzÄ cego ze zbiorów BN. Ten utwór nie jest chroniony prawem autorskim i znajduje +siÄ w domenie publicznej, co oznacza, że możesz go swobodnie wykorzystywaÄ, publikowaÄ i rozpowszechniaÄ. +----- + +""" + + REGEXES = [ (r'<rdf:RDF[^>]*>(.|\n)*?</rdf:RDF>', ''), (r'<motyw[^>]*>(.|\n)*?</motyw>', ''), @@ -50,7 +61,8 @@ if __name__ == '__main__': # print pattern, repl xml, n = re.subn(pattern, repl, xml) # print n - + output = codecs.open(output_filename, 'w', encoding='utf-8') + output.write(HEADER) output.write(xml)