+ "nbsp",
+ exclude=[DCNS("identifier.url"), DCNS("rights.license")]
+ )
+
+
+def fix_tables(doc):
+ for kol in doc.iter(tag='kol'):
+ if kol.tail is not None:
+ if not kol.tail.strip():
+ kol.tail = None
+ for table in chain(doc.iter(tag='tabela'), doc.iter(tag='tabelka')):
+ if table.get('ramka') == '1' or table.get('ramki') == '1':
+ table.set('_format', '|' + 'X|' * len(table[0]))
+ else:
+ table.set('_format', 'X' * len(table[0]))
+
+
+def mark_subauthors(doc):
+ root_author = ', '.join(elem.text for elem in doc.findall('./' + RDFNS('RDF') + '//' + DCNS('creator_parsed')))
+ last_author = None
+ # jeśli autor jest inny niż autor całości i niż poprzedni autor
+ # to wstawiamy jakiś znacznik w rdf?
+ for subutwor in doc.xpath('/utwor/utwor'):
+ author = ', '.join(elem.text for elem in subutwor.findall('.//' + DCNS('creator_parsed')))
+ if author not in (last_author, root_author):
+ subutwor.find('.//' + RDFNS('RDF')).append(etree.Element('use_subauthor'))
+ last_author = author
+
+
+def move_motifs_inside(doc):
+ """ moves motifs to be into block elements """
+ for master in doc.xpath('//powiesc|//opowiadanie|//liryka_l|//liryka_lp|'
+ '//dramat_wierszowany_l|//dramat_wierszowany_lp|//dramat_wspolczesny'):
+ for motif in master.xpath('motyw'):
+ for sib in motif.itersiblings():
+ if sib.tag not in ('sekcja_swiatlo', 'sekcja_asterysk', 'separator_linia',
+ 'begin', 'end', 'motyw', 'extra', 'uwaga'):
+ # motif shouldn't have a tail - it would be untagged text
+ motif.tail = None
+ motif.getparent().remove(motif)
+ sib.insert(0, motif)
+ break
+
+
+def hack_motifs(doc):
+ """ dirty hack for the marginpar-creates-orphans LaTeX problem
+ see http://www.latex-project.org/cgi-bin/ltxbugs2html?pr=latex/2304