fnp
/
wolnelektury.git
/ commitdiff
commit
grep
author
committer
pickaxe
?
search:
re
summary
|
shortlog
|
log
|
commit
| commitdiff |
tree
raw
|
patch
|
inline
| side by side (from parent 1:
c7a3514
)
Dodanie linku do strony lektury w WolneLektury.pl do wynikowych plików tekstowych...
author
Marek Stępniowski
<marek@stepniowski.com>
Mon, 10 Aug 2009 10:56:14 +0000
(12:56 +0200)
committer
Marek Stępniowski
<marek@stepniowski.com>
Mon, 10 Aug 2009 10:56:14 +0000
(12:56 +0200)
lib/librarian/bin/book2txt.py
patch
|
blob
|
history
diff --git
a/lib/librarian/bin/book2txt.py
b/lib/librarian/bin/book2txt.py
index
9c47080
..
d3c2d01
100755
(executable)
--- a/
lib/librarian/bin/book2txt.py
+++ b/
lib/librarian/bin/book2txt.py
@@
-5,6
+5,8
@@
import os
import optparse
import codecs
import optparse
import codecs
+from librarian import dcparser
+
HEADER = u"""\
Kodowanie znaków w dokumencie: UTF-8.
HEADER = u"""\
Kodowanie znaków w dokumencie: UTF-8.
@@
-12,10
+14,15
@@
Kodowanie znaków w dokumencie: UTF-8.
Publikacja zrealizowana w ramach projektu Wolne Lektury (http://wolnelektury.pl/). Reprodukcja cyfrowa wykonana przez
Bibliotekę Narodową z egzemplarza pochodzącego ze zbiorów BN. Ten utwór nie jest chroniony prawem autorskim i znajduje
się w domenie publicznej, co oznacza, że możesz go swobodnie wykorzystywać, publikować i rozpowszechniać.
Publikacja zrealizowana w ramach projektu Wolne Lektury (http://wolnelektury.pl/). Reprodukcja cyfrowa wykonana przez
Bibliotekę Narodową z egzemplarza pochodzącego ze zbiorów BN. Ten utwór nie jest chroniony prawem autorskim i znajduje
się w domenie publicznej, co oznacza, że możesz go swobodnie wykorzystywać, publikować i rozpowszechniać.
+
+Wersja lektury w opracowaniu merytorycznym i krytycznym (przypisy i motywy) dostępna jest na stronie %s.
-----
"""
-----
"""
+def get_header(filename):
+ return HEADER % dcparser.parse(filename).url
+
REGEXES = [
(r'<rdf:RDF[^>]*>(.|\n)*?</rdf:RDF>', ''),
REGEXES = [
(r'<rdf:RDF[^>]*>(.|\n)*?</rdf:RDF>', ''),
@@
-58,11
+65,9
@@
if __name__ == '__main__':
xml = codecs.open(input_filename, 'r', encoding='utf-8').read()
for pattern, repl in REGEXES:
xml = codecs.open(input_filename, 'r', encoding='utf-8').read()
for pattern, repl in REGEXES:
- # print pattern, repl
xml, n = re.subn(pattern, repl, xml)
xml, n = re.subn(pattern, repl, xml)
- # print n
output = codecs.open(output_filename, 'w', encoding='utf-8')
output = codecs.open(output_filename, 'w', encoding='utf-8')
- output.write(
HEADER
)
+ output.write(
get_header(input_filename)
)
output.write(xml)
output.write(xml)