Fix XML entities left from MathML.
[librarian.git] / tests / test_html_fragments.py
1 # -*- coding: utf-8 -*-
2 #
3 # This file is part of Librarian, licensed under GNU Affero GPLv3 or later.
4 # Copyright © Fundacja Nowoczesna Polska. See NOTICE for more information.
5 #
6 from __future__ import unicode_literals
7
8 from librarian.html import extract_fragments
9 from nose.tools import *
10 from .utils import get_fixture
11
12
13 def test_fragments():
14     expected_output_file_path = get_fixture('text', 'asnyk_miedzy_nami_fragments.html')
15
16     closed_fragments, open_fragments = extract_fragments(
17         get_fixture('text', 'asnyk_miedzy_nami_expected.html'))
18     assert not open_fragments
19     fragments_text = u"\n\n".join(u"%s: %s\n%s" % (f.id, f.themes, f) for f in sorted(closed_fragments.values(), key=lambda f: f.id))
20     assert_equal(fragments_text, open(expected_output_file_path, 'rb').read().decode('utf-8'))