Dodanie linku do strony lektury w WolneLektury.pl do wynikowych plików tekstowych...
authorMarek Stępniowski <marek@stepniowski.com>
Mon, 10 Aug 2009 10:56:14 +0000 (12:56 +0200)
committerMarek Stępniowski <marek@stepniowski.com>
Mon, 10 Aug 2009 10:56:14 +0000 (12:56 +0200)
lib/librarian/bin/book2txt.py

index 9c47080..d3c2d01 100755 (executable)
@@ -5,6 +5,8 @@ import os
 import optparse
 import codecs
 
+from librarian import dcparser
+
 
 HEADER = u"""\
 Kodowanie znaków w dokumencie: UTF-8.
@@ -12,10 +14,15 @@ Kodowanie znaków w dokumencie: UTF-8.
 Publikacja zrealizowana w ramach projektu Wolne Lektury (http://wolnelektury.pl/). Reprodukcja cyfrowa wykonana przez
 Bibliotekę Narodową z egzemplarza pochodzącego ze zbiorów BN. Ten utwór nie jest chroniony prawem autorskim i znajduje
 się w domenie publicznej, co oznacza, że możesz go swobodnie wykorzystywać, publikować i rozpowszechniać.
+
+Wersja lektury w opracowaniu merytorycznym i krytycznym (przypisy i motywy) dostępna jest na stronie %s.
 -----
 
 """
 
+def get_header(filename):
+    return HEADER % dcparser.parse(filename).url
+
 
 REGEXES = [
     (r'<rdf:RDF[^>]*>(.|\n)*?</rdf:RDF>', ''),
@@ -58,11 +65,9 @@ if __name__ == '__main__':
         
         xml = codecs.open(input_filename, 'r', encoding='utf-8').read()
         for pattern, repl in REGEXES:
-            # print pattern, repl
             xml, n = re.subn(pattern, repl, xml)
-            # print n
         
         output = codecs.open(output_filename, 'w', encoding='utf-8')
-        output.write(HEADER)
+        output.write(get_header(input_filename))
         output.write(xml)