'begin': ('_ignore', True, {'class': 'reference'}, {'data-uri': 'href'}, False),
'end': ('_ignore', True, {'class': 'reference'}, {'data-uri': 'href'}, False),
- 'motyw': ('a', True, {'class': 'theme'}, None, False),
+ 'motyw': ('_ignore', True, {'class': 'theme'}, None, False),
'pa': ('a', True, {'class': 'footnote footnote-pa'}, None, False),
'pe': ('a', True, {'class': 'footnote footnote-pe'}, None, False),
'pr': ('a', True, {'class': 'footnote footnote-pr'}, None, False),
'pt': ('a', True, {'class': 'footnote footnote-pt'}, None, False),
'ptrad': ('a', True, {'class': 'footnote footnote-ptrad'}, None, False),
+
+ 'werset': ('p', True, {'class': 'werset'}, None, True),
+ 'br': ('br', False, None, None, None),
+ 'indeks_dolny': ('em', True, {'class': 'indeks_dolny'}, None, False),
+ 'mat': ('span', True, {'class': 'mat'}, None, False),
}
id_prefixes = {
def norm(text):
- text = text.replace('---', '—').replace('--', '–').replace('...', '…').replace(',,', '„').replace('"', '”')
+ text = text.replace('---', '—').replace('--', '–').replace('...', '…').replace(',,', '„').replace('"', '”').replace('\n', ' ')
return text