From f49f480ec083dbd9300b354c1730bdae564beaf0 Mon Sep 17 00:00:00 2001 From: =?utf8?q?Marek=20St=C4=99pniowski?= Date: Mon, 10 Aug 2009 12:56:14 +0200 Subject: [PATCH] =?utf8?q?Dodanie=20linku=20do=20strony=20lektury=20w=20Wo?= =?utf8?q?lneLektury.pl=20do=20wynikowych=20plik=C3=B3w=20tekstowych=20skr?= =?utf8?q?yptu=20book2txt.py=20w=20bibliotece=20librarian.?= MIME-Version: 1.0 Content-Type: text/plain; charset=utf8 Content-Transfer-Encoding: 8bit --- lib/librarian/bin/book2txt.py | 11 ++++++++--- 1 file changed, 8 insertions(+), 3 deletions(-) diff --git a/lib/librarian/bin/book2txt.py b/lib/librarian/bin/book2txt.py index 9c470805e..d3c2d0121 100755 --- a/lib/librarian/bin/book2txt.py +++ b/lib/librarian/bin/book2txt.py @@ -5,6 +5,8 @@ import os import optparse import codecs +from librarian import dcparser + HEADER = u"""\ Kodowanie znaków w dokumencie: UTF-8. @@ -12,10 +14,15 @@ Kodowanie znaków w dokumencie: UTF-8. Publikacja zrealizowana w ramach projektu Wolne Lektury (http://wolnelektury.pl/). Reprodukcja cyfrowa wykonana przez Bibliotekę Narodową z egzemplarza pochodzącego ze zbiorów BN. Ten utwór nie jest chroniony prawem autorskim i znajduje się w domenie publicznej, co oznacza, że możesz go swobodnie wykorzystywać, publikować i rozpowszechniać. + +Wersja lektury w opracowaniu merytorycznym i krytycznym (przypisy i motywy) dostępna jest na stronie %s. ----- """ +def get_header(filename): + return HEADER % dcparser.parse(filename).url + REGEXES = [ (r']*>(.|\n)*?', ''), @@ -58,11 +65,9 @@ if __name__ == '__main__': xml = codecs.open(input_filename, 'r', encoding='utf-8').read() for pattern, repl in REGEXES: - # print pattern, repl xml, n = re.subn(pattern, repl, xml) - # print n output = codecs.open(output_filename, 'w', encoding='utf-8') - output.write(HEADER) + output.write(get_header(input_filename)) output.write(xml) -- 2.20.1