annotations and motifs forbidden in nota_red
authorRadek Czajka <radoslaw.czajka@nowoczesnapolska.org.pl>
Wed, 24 Nov 2010 09:04:13 +0000 (10:04 +0100)
committerRadek Czajka <radoslaw.czajka@nowoczesnapolska.org.pl>
Wed, 24 Nov 2010 09:04:13 +0000 (10:04 +0100)
librarian/html.py
librarian/parser.py

index c942fe7..f7bd618 100644 (file)
@@ -49,6 +49,8 @@ def transform(input, output_filename=None, is_file=True, \
             document = WLDocument.from_string(input, True, \
                 parse_dublincore=parse_dublincore)
 
             document = WLDocument.from_string(input, True, \
                 parse_dublincore=parse_dublincore)
 
+        document.clean_ed_note()
+
         result = document.transform(style, **options)
         del document # no longer needed large object :)
 
         result = document.transform(style, **options)
         del document # no longer needed large object :)
 
index b470957..3f9f710 100644 (file)
@@ -119,4 +119,14 @@ class WLDocument(object):
             except Exception, e:
                 unmerged.append( repr( (key, xpath, e) ) )
 
             except Exception, e:
                 unmerged.append( repr( (key, xpath, e) ) )
 
-        return unmerged
\ No newline at end of file
+        return unmerged
+
+    def clean_ed_note(self):
+        """ deletes forbidden tags from nota_red """
+
+        for node in self.edoc.xpath('|'.join('//nota_red//%s' % tag for tag in
+                    ('pa', 'pe', 'pr', 'pt', 'begin', 'end', 'motyw'))):
+            tail = node.tail
+            node.clear()
+            node.tag = 'span'
+            node.tail = tail