From 07fdba2c7fe8e11b6867712d47bdd608e88c29fb Mon Sep 17 00:00:00 2001
From: =?utf8?q?Marek=20St=C4=99pniowski?= <marek@stepniowski.com>
Date: Fri, 19 Mar 2010 16:59:37 +0100
Subject: [PATCH] Extracted from project "Wolnelektury.pl". Version 1.1

---
 .gitignore                                    |   4 +
 MANIFEST.in                                   |   2 +
 librarian/__init__.py                         |   0
 librarian/__init__.pyc                        | Bin 0 -> 151 bytes
 librarian/book2html.xslt                      | 615 ++++++++++++++++++
 librarian/book2txt.xslt                       | 321 +++++++++
 librarian/dcparser.py                         | 197 ++++++
 librarian/dcparser.pyc                        | Bin 0 -> 8696 bytes
 librarian/html.py                             | 242 +++++++
 librarian/html.pyc                            | Bin 0 -> 8882 bytes
 librarian/tests/__init__.py                   | 115 ++++
 librarian/tests/files/dcparser/.DS_Store      | Bin 0 -> 6148 bytes
 .../dcparser/andersen_brzydkie_kaczatko.xml   |  24 +
 .../files/dcparser/biedrzycki_akslop.xml      |  25 +
 .../files/dcparser/kochanowski_piesn7.xml     |  27 +
 .../tests/files/dcparser/mickiewicz_rybka.xml |  28 +
 .../files/dcparser/sofokles_antygona.xml      |  25 +
 .../files/erroneous/asnyk_miedzy_nami.html    |  46 ++
 .../files/erroneous/asnyk_miedzy_nami.xml     |  25 +
 librarian/text.py                             |  89 +++
 librarian/text.pyc                            | Bin 0 -> 2993 bytes
 scripts/book2html                             |  31 +
 scripts/book2txt                              |  31 +
 scripts/bookfragments                         |  50 ++
 scripts/genslugs                              |  64 ++
 scripts/master.css                            | 207 ++++++
 scripts/master.plain.css                      | 160 +++++
 setup.py                                      |  19 +
 28 files changed, 2347 insertions(+)
 create mode 100644 .gitignore
 create mode 100644 MANIFEST.in
 create mode 100644 librarian/__init__.py
 create mode 100644 librarian/__init__.pyc
 create mode 100644 librarian/book2html.xslt
 create mode 100644 librarian/book2txt.xslt
 create mode 100644 librarian/dcparser.py
 create mode 100644 librarian/dcparser.pyc
 create mode 100644 librarian/html.py
 create mode 100644 librarian/html.pyc
 create mode 100644 librarian/tests/__init__.py
 create mode 100644 librarian/tests/files/dcparser/.DS_Store
 create mode 100644 librarian/tests/files/dcparser/andersen_brzydkie_kaczatko.xml
 create mode 100644 librarian/tests/files/dcparser/biedrzycki_akslop.xml
 create mode 100644 librarian/tests/files/dcparser/kochanowski_piesn7.xml
 create mode 100644 librarian/tests/files/dcparser/mickiewicz_rybka.xml
 create mode 100644 librarian/tests/files/dcparser/sofokles_antygona.xml
 create mode 100644 librarian/tests/files/erroneous/asnyk_miedzy_nami.html
 create mode 100644 librarian/tests/files/erroneous/asnyk_miedzy_nami.xml
 create mode 100644 librarian/text.py
 create mode 100644 librarian/text.pyc
 create mode 100755 scripts/book2html
 create mode 100755 scripts/book2txt
 create mode 100755 scripts/bookfragments
 create mode 100755 scripts/genslugs
 create mode 100644 scripts/master.css
 create mode 100644 scripts/master.plain.css
 create mode 100644 setup.py

diff --git a/.gitignore b/.gitignore
new file mode 100644
index 0000000..7189e7b
--- /dev/null
+++ b/.gitignore
@@ -0,0 +1,4 @@
+.DS_Store
+*.pyc
+MANIFEST
+dist
diff --git a/MANIFEST.in b/MANIFEST.in
new file mode 100644
index 0000000..4c76fc3
--- /dev/null
+++ b/MANIFEST.in
@@ -0,0 +1,2 @@
+include librarian/*.xslt
+recursive-include librarian/tests/files/ *.xml
diff --git a/librarian/__init__.py b/librarian/__init__.py
new file mode 100644
index 0000000..e69de29
diff --git a/librarian/__init__.pyc b/librarian/__init__.pyc
new file mode 100644
index 0000000000000000000000000000000000000000..3d4eb1301d13decc7aa425513c20d7c2e466f51b
GIT binary patch
literal 151
zcmdn|iI+?LgQ{mT0~9a<X$K%KW&si@3=F{<AQ3+eAi;n}6gvRL^h1kNi;DHDN|REH
z^aG0Wvr@B5D)r0rbMjJifXvdOO5OC#68)UaBoHo2EXqvG(~pnO%*!l^kJl@xEam_j
SVw0PnQks)$2ePUdh#3I)UL$}2

literal 0
HcmV?d00001

diff --git a/librarian/book2html.xslt b/librarian/book2html.xslt
new file mode 100644
index 0000000..71f1182
--- /dev/null
+++ b/librarian/book2html.xslt
@@ -0,0 +1,615 @@
+<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
+    xmlns:wl="http://wolnelektury.pl/functions" >
+
+<xsl:output encoding="utf-8" indent="yes" omit-xml-declaration = "yes" version="2.0" />
+
+
+<xsl:template match="utwor">
+    <!-- <html>
+        <head>
+            <title>KsiÄÅ¼ka z serwisu WolneLektury.pl</title>
+            <meta http-equiv="content-type" content="text/html;charset=utf-8"/>
+        </head>
+        <style>
+            body {
+                font-size: 16px;
+                font: Georgia, "Times New Roman", serif;
+                line-height: 1.5em;
+                margin: 0;
+            }
+
+            a {
+                color: blue;
+                text-decoration: none;
+            }
+
+            #book-text {
+                margin: 3em;
+                max-width: 36em;
+            }
+
+            /* ================================== */
+            /* = Header with logo and menu      = */
+            /* ================================== */
+            #header {
+                margin: 3.4em 0 0 1.4em;
+            }
+
+            img {
+                border: none;
+            }
+
+
+            #menu {
+                position: fixed;
+                left: 0em;
+                top: 0em;
+                width: 100%;
+                height: 1.5em;
+                background: #333;
+                color: #FFF;
+                opacity: 0.9;
+            }
+
+            #menu ul {
+                list-style: none;
+                padding: 0;
+                margin: 0;
+            }
+
+            #menu li a {
+                display: block;
+                float: left;
+                width: 7.5em;
+                height: 1.5em;
+                margin-left: 0.5em;
+                text-align: center;
+                color: #FFF;
+            }
+
+            #menu li a:hover, #menu li a:active {
+                color: #000;
+                background: #FFF url(/media/img/arrow-down.png) no-repeat center right;
+            }
+
+            #menu li a.selected {
+                color: #000;
+                background: #FFF url(/media/img/arrow-up.png) no-repeat center right;
+            }
+
+            #toc, #themes {
+                position: fixed;
+                left: 0em;
+                top: 1.5em;
+                width: 37em;
+                padding: 1.5em;
+                background: #FFF;
+                border-bottom: 0.25em solid #DDD;
+                border-right: 0.25em solid #DDD;
+                display: none;
+                height: 16em;
+                overflow-x: hidden;
+                overflow-y: auto;
+                opacity: 0.9;
+            }
+
+            #toc ol, #themes ol {
+                list-style: none;
+                padding: 0;
+                margin: 0;
+            }
+
+            #toc ol li {
+                font-weight: bold;
+            }
+
+            #toc ol ol {
+                padding: 0 0 1.5em 1.5em;
+                margin: 0;
+            }
+
+            #toc ol ol li {
+                font-weight: normal;
+            }
+
+            #toc h2 {
+                display: none;
+            }
+
+            #toc .anchor {
+                float: none;
+                margin: 0;
+                color: blue;
+                font-size: 16px;
+                position: inherit;
+            }
+
+            /* =================================================== */
+            /* = Common elements: headings, paragraphs and lines = */
+            /* =================================================== */
+            h1 {
+                font-size: 3em;
+                margin: 1.5em 0;
+                text-align: center;
+                line-height: 1.5em;
+                font-weight: bold;
+            }
+
+            h2 {
+                font-size: 2em;
+                margin: 1.5em 0 0;
+                font-weight: bold;
+                line-height: 1.5em;
+            }
+
+            h3 {
+                font-size: 1.5em;
+                margin: 1.5em 0 0;
+                font-weight: normal;
+                line-height: 1.5em;
+            }
+
+            h4 {
+                font-size: 1em;
+                margin: 1.5em 0 0;
+                line-height: 1.5em;
+            }
+
+            p {
+                margin: 0;
+            }
+
+            /* ======================== */
+            /* = Footnotes and themes = */
+            /* ======================== */
+            .theme-begin {
+                border-left: 0.1em solid #DDDDDD;
+                color: #777;
+                padding: 0 0.5em;
+                width: 7.5em;
+                font-style: normal;
+                font-weight: normal;
+                font-size: 16px;
+                float: right;
+                margin-right: -9.5em;
+                clear: both;
+                left: 40em;
+                line-height: 1.5em;
+                text-align: left;
+            }
+
+            .annotation {
+                font-style: normal;
+                font-weight: normal;
+                font-size: 12px;
+            }
+
+            #footnotes .annotation {
+                display: block;
+                float: left;
+                width: 2.5em;
+                clear: both;
+            }
+
+            #footnotes div {
+                margin: 1.5em 0 0 0;
+            }
+
+            #footnotes p {
+                margin-left: 2.5em;
+                font-size: 0.875em;
+            }
+
+            blockquote {
+                font-size: 0.875em;
+            }
+
+            /* ============= */
+            /* = Numbering = */
+            /* ============= */
+            .anchor {
+                position: absolute;
+                margin: -0.25em -0.5em;
+                left: 1em;
+                color: #777;
+                font-size: 12px;
+                width: 2em;
+                text-align: center;
+                padding: 0.25em 0.5em;
+                line-height: 1.5em;
+            }
+
+            .anchor:hover, #book-text .anchor:active {
+                color: #FFF;
+                background-color: #CCC;
+            }
+
+            /* =================== */
+            /* = Custom elements = */
+            /* =================== */
+            span.author {
+                font-size: 0.5em;
+                display: block;
+                line-height: 1.5em;
+                margin-bottom: 0.25em;
+            }
+
+            span.collection {
+                font-size: 0.375em;
+                display: block;
+                line-height: 1.5em;
+                margin-bottom: -0.25em;
+            }
+
+            span.subtitle {
+                font-size: 0.5em;
+                display: block;
+                line-height: 1.5em;
+                margin-top: -0.25em;
+            }
+
+            div.didaskalia {
+                font-style: italic;
+                margin: 0.5em 0 0 1.5em;
+            }
+
+            div.kwestia {
+                margin: 0.5em 0 0;
+            }
+
+            div.stanza {
+                margin: 1.5em 0 0;
+            }
+
+            div.kwestia div.stanza {
+                margin: 0;
+            }
+
+            p.paragraph {
+                text-align: justify;
+                margin: 1.5em 0 0;
+            }
+
+            p.motto {
+                text-align: justify;
+                font-style: italic;
+                margin: 1.5em 0 0;
+            }
+
+            p.motto_podpis {
+                font-size: 0.875em;
+                text-align: right;
+            }
+
+            div.fragment {
+                border-bottom: 0.1em solid #999;
+                padding-bottom: 1.5em;
+            }
+
+            div.note p, div.dedication p, div.note p.paragraph, div.dedication p.paragraph {
+                text-align: right;
+                font-style: italic;
+            }
+
+            hr.spacer {
+                height: 3em;
+                visibility: hidden;
+            }
+
+            hr.spacer-line {
+                margin: 1.5em 0;
+                border: none;
+                border-bottom: 0.1em solid #000;
+            }
+
+            p.spacer-asterisk {
+                padding: 0;
+                margin: 1.5em 0;
+                text-align: center;
+            }
+
+            div.person-list ol {
+                list-style: none;
+                padding: 0 0 0 1.5em;
+            }
+
+            p.place-and-time {
+                font-style: italic;
+            }
+
+            em.math, em.foreign-word, em.book-title, em.didaskalia {
+                font-style: italic;
+            }
+
+            em.author-emphasis {
+                letter-spacing: 0.1em;
+            }
+
+            em.person {
+                font-style: normal;
+                font-variant: small-caps;
+            }
+        </style>
+        <body> -->
+        <div id="book-text">
+            <xsl:apply-templates select="powiesc|opowiadanie|liryka_l|liryka_lp|dramat_wierszowany_l|dramat_wierszowany_lp|dramat_wspolczesny" />
+            <xsl:if test="count(descendant::*[self::pe or self::pa or self::pr or self::pt][not(parent::extra)])">
+                <div id="footnotes">
+                    <h3>Przypisy</h3>
+                    <xsl:for-each select="descendant::*[self::pe or self::pa or self::pr or self::pt][not(parent::extra)]">
+                        <div>
+                            <a name="{concat('footnote-', generate-id(.))}" />
+                            <a href="{concat('#anchor-', generate-id(.))}" class="annotation">[<xsl:number value="count(preceding::*[self::pa or self::pe or self::pr or self::pt]) + 1" />]</a>
+                            <xsl:choose>
+                                <xsl:when test="count(akap|akap_cd|strofa) = 0">
+                                    <p><xsl:apply-templates select="text()|*" mode="inline" /></p>
+                                </xsl:when>
+                                <xsl:otherwise>
+                                    <xsl:apply-templates select="text()|*" mode="inline" />
+                                </xsl:otherwise>
+                            </xsl:choose>
+                        </div>
+                    </xsl:for-each>
+                </div>
+            </xsl:if>
+        </div>
+        <!-- </body>
+    </html> -->
+</xsl:template>
+
+
+<!-- ============================================================================== -->
+<!-- = MASTER TAG                                                                 = -->
+<!-- = (can contain block tags, paragraph tags, standalone tags and special tags) = -->
+<!-- ============================================================================== -->
+<xsl:template match="powiesc|opowiadanie|liryka_l|liryka_lp|dramat_wierszowany_l|dramat_wierszowany_lp|dramat_wspolczesny">
+    <xsl:if test="nazwa_utworu">
+        <h1>
+            <xsl:apply-templates select="autor_utworu|dzielo_nadrzedne|nazwa_utworu|podtytul" mode="header" />
+        </h1>
+    </xsl:if>
+    <xsl:apply-templates />
+</xsl:template>
+
+
+<!-- ==================================================================================== -->
+<!-- = BLOCK TAGS                                                                       = -->
+<!-- = (can contain other block tags, paragraph tags, standalone tags and special tags) = -->
+<!-- ==================================================================================== -->
+<xsl:template match="nota">
+    <div class="note"><xsl:apply-templates /></div>
+</xsl:template>
+
+<xsl:template match="lista_osob">
+    <div class="person-list">
+        <h3><xsl:value-of select="naglowek_listy" /></h3>
+        <ol>
+            <xsl:apply-templates select="lista_osoba" />
+        </ol>
+    </div>
+</xsl:template>
+
+<xsl:template match="dedykacja">
+    <div class="dedication"><xsl:apply-templates /></div>
+</xsl:template>
+
+<xsl:template match="kwestia">
+    <div class="kwestia">
+        <xsl:apply-templates select="strofa|akap|didaskalia" />
+    </div>
+</xsl:template>
+
+<xsl:template match="dlugi_cytat|poezja_cyt">
+    <blockquote><xsl:apply-templates /></blockquote>
+</xsl:template>
+
+<xsl:template match="motto">
+    <div class="motto"><xsl:apply-templates mode="inline" /></div>
+</xsl:template>
+
+
+<!-- ========================================== -->
+<!-- = PARAGRAPH TAGS                         = -->
+<!-- = (can contain inline and special tags)  = -->
+<!-- ========================================== -->
+<!-- Title page -->
+<xsl:template match="autor_utworu" mode="header">
+    <span class="author"><xsl:apply-templates mode="inline" /></span>
+</xsl:template>
+
+<xsl:template match="nazwa_utworu" mode="header">
+    <span class="title"><xsl:apply-templates mode="inline" /></span>
+</xsl:template>
+
+<xsl:template match="dzielo_nadrzedne" mode="header">
+    <span class="collection"><xsl:apply-templates mode="inline" /></span>
+</xsl:template>
+
+<xsl:template match="podtytul" mode="header">
+    <span class="subtitle"><xsl:apply-templates mode="inline" /></span>
+</xsl:template>
+
+<!-- Section headers (included in index)-->
+<xsl:template match="naglowek_akt|naglowek_czesc|srodtytul">
+    <h2><xsl:apply-templates mode="inline" /></h2>
+</xsl:template>
+
+<xsl:template match="naglowek_scena|naglowek_rozdzial">
+    <h3><xsl:apply-templates mode="inline" /></h3>
+</xsl:template>
+
+<xsl:template match="naglowek_osoba|naglowek_podrozdzial">
+    <h4><xsl:apply-templates mode="inline" /></h4>
+</xsl:template>
+
+<!-- Other paragraph tags -->
+<xsl:template match="miejsce_czas">
+    <p class="place-and-time"><xsl:apply-templates mode="inline" /></p>
+</xsl:template>
+
+<xsl:template match="didaskalia">
+    <div class="didaskalia"><xsl:apply-templates mode="inline" /></div>
+</xsl:template>
+
+<xsl:template match="lista_osoba">
+    <li><xsl:apply-templates mode="inline" /></li>
+</xsl:template>
+
+<xsl:template match="akap|akap_dialog|akap_cd">
+    <p class="paragraph"><xsl:apply-templates mode="inline" /></p>
+</xsl:template>
+
+<xsl:template match="strofa">
+    <div class="stanza">
+        <xsl:choose>
+            <xsl:when test="count(br) > 0">     
+                <xsl:call-template name="verse">
+                    <xsl:with-param name="verse-content" select="br[1]/preceding-sibling::text() | br[1]/preceding-sibling::node()" />
+                    <xsl:with-param name="verse-type" select="br[1]/preceding-sibling::*[name() = 'wers_wciety' or name() = 'wers_akap' or name() = 'wers_cd'][1]" />
+                </xsl:call-template>    
+                <xsl:for-each select="br">		
+        			<!-- Each BR tag "consumes" text after it -->
+                    <xsl:variable name="lnum" select="count(preceding-sibling::br)" />
+                    <xsl:call-template name="verse">
+                        <xsl:with-param name="verse-content" 
+                            select="following-sibling::text()[count(preceding-sibling::br) = $lnum+1] | following-sibling::node()[count(preceding-sibling::br) = $lnum+1]" />
+                        <xsl:with-param name="verse-type" select="following-sibling::*[count(preceding-sibling::br) = $lnum+1 and (name() = 'wers_wciety' or name() = 'wers_akap' or name() = 'wers_cd')][1]" />
+                    </xsl:call-template>
+                </xsl:for-each>
+            </xsl:when>
+            <xsl:otherwise>
+                <xsl:call-template name="verse">
+                    <xsl:with-param name="verse-content" select="text() | node()" />
+                    <xsl:with-param name="verse-type" select="wers_wciety|wers_akap|wers_cd[1]" />
+                 </xsl:call-template>           
+            </xsl:otherwise>
+        </xsl:choose>
+    </div>
+</xsl:template>
+
+<xsl:template name="verse">
+    <xsl:param name="verse-content" />
+    <xsl:param name="verse-type" />
+    <p class="verse">
+        <xsl:choose>
+            <xsl:when test="name($verse-type) = 'wers_akap'">
+                <xsl:attribute name="style">padding-left: 1em</xsl:attribute>
+            </xsl:when>
+            <xsl:when test="name($verse-type) = 'wers_wciety'">
+                <xsl:choose>
+                    <xsl:when test="$verse-content/@typ">
+                        <xsl:attribute name="style">padding-left: <xsl:value-of select="$verse-content/@typ" />em</xsl:attribute>
+                    </xsl:when>
+                    <xsl:otherwise>
+                        <xsl:attribute name="style">padding-left: 1em</xsl:attribute>
+                    </xsl:otherwise>
+                </xsl:choose>
+            </xsl:when>
+            <xsl:when test="name($verse-type) = 'wers_cd'">
+                <xsl:attribute name="style">padding-left: 12em</xsl:attribute>
+            </xsl:when>
+        </xsl:choose>
+        <xsl:apply-templates select="$verse-content" mode="inline" />
+    </p>
+</xsl:template>
+
+<xsl:template match="motto_podpis">
+    <p class="motto_podpis"><xsl:apply-templates mode="inline" /></p>
+</xsl:template>
+
+
+<!-- ================================================ -->
+<!-- = INLINE TAGS                                  = -->
+<!-- = (contain other inline tags and special tags) = -->
+<!-- ================================================ -->
+<!-- Annotations -->
+<xsl:template match="pa|pe|pr|pt" mode="inline">
+    <a name="{concat('anchor-', generate-id(.))}" />
+    <a href="{concat('#footnote-', generate-id(.))}" class="annotation">[<xsl:number value="count(preceding::*[self::pa or self::pe or self::pr or self::pt]) + 1" />]</a>
+</xsl:template>
+
+<!-- Other inline tags -->
+<xsl:template match="mat" mode="inline">
+    <em class="math"><xsl:apply-templates mode="inline" /></em>
+</xsl:template>
+
+<xsl:template match="didask_tekst" mode="inline">
+    <em class="didaskalia"><xsl:apply-templates mode="inline" /></em>
+</xsl:template>
+
+<xsl:template match="slowo_obce" mode="inline">
+    <em class="foreign-word"><xsl:apply-templates mode="inline" /></em>
+</xsl:template>
+
+<xsl:template match="tytul_dziela" mode="inline">
+    <em class="book-title">
+        <xsl:if test="@typ = '1'">â</xsl:if><xsl:apply-templates mode="inline" /><xsl:if test="@typ = '1'">â</xsl:if>
+    </em>
+</xsl:template>
+
+<xsl:template match="wyroznienie" mode="inline">
+    <em class="author-emphasis"><xsl:apply-templates mode="inline" /></em>
+</xsl:template>
+
+<xsl:template match="osoba" mode="inline">
+    <em class="person"><xsl:apply-templates mode="inline" /></em>
+</xsl:template>
+
+
+<!-- ============================================== -->
+<!-- = STANDALONE TAGS                            = -->
+<!-- = (cannot contain any other tags)            = -->
+<!-- ============================================== -->
+<xsl:template match="sekcja_swiatlo">
+    <hr class="spacer" />
+</xsl:template>
+
+<xsl:template match="sekcja_asterysk">
+    <p class="spacer-asterisk">*</p>
+</xsl:template>
+
+<xsl:template match="separator_linia">
+    <hr class="spacer-line" />
+</xsl:template>
+
+
+<!-- ================ -->
+<!-- = SPECIAL TAGS = -->
+<!-- ================ -->
+<!-- Themes -->
+<xsl:template match="begin" mode="inline">
+    <xsl:variable name="mnum" select="concat('m', substring(@id, 2))" />
+    <a name="m{substring(@id, 2)}" class="theme-begin" fid="{substring(@id, 2)}">
+        <xsl:value-of select="string(following::motyw[@id=$mnum]/text())" />
+    </a>
+</xsl:template>
+
+<xsl:template match="end" mode="inline">
+    <span class="theme-end" fid="{substring(@id, 2)}"> </span>
+</xsl:template>
+
+<xsl:template match="begin|end">
+    <xsl:apply-templates select='.' mode="inline" />
+</xsl:template>
+
+<xsl:template match="motyw" mode="inline" />
+
+
+<!-- ================ -->
+<!-- = IGNORED TAGS = -->
+<!-- ================ -->
+<xsl:template match="extra|uwaga" />
+<xsl:template match="extra|uwaga" mode="inline" />
+
+
+<!-- ======== -->
+<!-- = TEXT = -->
+<!-- ======== -->
+<xsl:template match="text()" />
+<xsl:template match="text()" mode="inline">
+    <xsl:value-of select="wl:substitute_entities(.)" />
+</xsl:template>
+
+
+</xsl:stylesheet>
+
diff --git a/librarian/book2txt.xslt b/librarian/book2txt.xslt
new file mode 100644
index 0000000..cd98524
--- /dev/null
+++ b/librarian/book2txt.xslt
@@ -0,0 +1,321 @@
+<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
+    xmlns:wl="http://wolnelektury.pl/functions" >
+
+<xsl:output encoding="utf-8" method="text" />
+
+<!-- ============================================================================== -->
+<!-- = MASTER TAG                                                                 = -->
+<!-- = (can contain block tags, paragraph tags, standalone tags and special tags) = -->
+<!-- ============================================================================== -->
+<xsl:template match="powiesc|opowiadanie|liryka_l|liryka_lp|dramat_wierszowany_l|dramat_wierszowany_lp|dramat_wspolczesny">
+<xsl:text>Kodowanie znakÃ³w w dokumencie: UTF-8.
+-----
+Publikacja zrealizowana w ramach projektu Wolne Lektury (http://wolnelektury.pl/). Reprodukcja cyfrowa wykonana przez
+BibliotekÄ NarodowÄ z egzemplarza pochodzÄcego ze zbiorÃ³w BN. Ten utwÃ³r nie jest chroniony prawem autorskim i znajduje
+siÄ w domenie publicznej, co oznacza, Å¼e moÅ¼esz go swobodnie wykorzystywaÄ, publikowaÄ i rozpowszechniaÄ.
+
+Wersja lektury w opracowaniu merytorycznym i krytycznym (przypisy i motywy) dostÄpna jest na stronie %s.
+-----
+
+
+</xsl:text>
+<xsl:if test="nazwa_utworu"><xsl:apply-templates select="autor_utworu|dzielo_nadrzedne|nazwa_utworu|podtytul" mode="header" /></xsl:if>
+<xsl:text>
+
+</xsl:text>
+<xsl:apply-templates />
+</xsl:template>
+
+
+<!-- ==================================================================================== -->
+<!-- = BLOCK TAGS                                                                       = -->
+<!-- = (can contain other block tags, paragraph tags, standalone tags and special tags) = -->
+<!-- ==================================================================================== -->
+<xsl:template match="nota">
+<xsl:apply-templates />
+</xsl:template>
+
+<xsl:template match="lista_osob">
+<xsl:text>
+
+
+</xsl:text>
+<xsl:value-of select="naglowek_listy" />
+<xsl:apply-templates select="lista_osoba" />
+<xsl:text>
+</xsl:text>
+</xsl:template>
+
+<xsl:template match="dedykacja">
+<xsl:text>
+
+</xsl:text>
+<xsl:apply-templates />
+</xsl:template>
+
+<xsl:template match="kwestia">
+<xsl:apply-templates select="strofa|akap|didaskalia" />
+</xsl:template>
+
+<xsl:template match="dlugi_cytat|poezja_cyt">
+<xsl:text>
+</xsl:text>
+<xsl:apply-templates />
+</xsl:template>
+
+<xsl:template match="motto">
+<xsl:text>
+
+
+
+</xsl:text>
+<xsl:apply-templates /><xsl:text>
+
+</xsl:text>
+</xsl:template>
+
+
+<!-- ========================================== -->
+<!-- = PARAGRAPH TAGS                         = -->
+<!-- = (can contain inline and special tags)  = -->
+<!-- ========================================== -->
+<!-- Title page -->
+<xsl:template match="autor_utworu" mode="header">
+<xsl:text>
+
+</xsl:text>
+<xsl:apply-templates mode="inline" />
+</xsl:template>
+
+<xsl:template match="nazwa_utworu" mode="header">
+<xsl:text>
+
+</xsl:text>
+<xsl:apply-templates mode="inline" />
+</xsl:template>
+
+<xsl:template match="dzielo_nadrzedne" mode="header">
+<xsl:text>
+    
+</xsl:text>
+<xsl:apply-templates mode="inline" />
+</xsl:template>
+
+<xsl:template match="podtytul" mode="header">
+<xsl:text>
+</xsl:text>
+<xsl:apply-templates mode="inline" />
+</xsl:template>
+
+<!-- Section headers (included in index)-->
+<xsl:template match="naglowek_akt|naglowek_czesc|srodtytul">
+<xsl:text>
+
+
+
+
+</xsl:text>
+<xsl:apply-templates mode="inline" />
+</xsl:template>
+
+<xsl:template match="naglowek_scena|naglowek_rozdzial">
+<xsl:text>
+
+
+
+</xsl:text>
+<xsl:apply-templates mode="inline" />
+</xsl:template>
+
+<xsl:template match="naglowek_osoba|naglowek_podrozdzial">
+<xsl:text>
+
+
+</xsl:text>
+<xsl:apply-templates mode="inline" />
+</xsl:template>
+
+<!-- Other paragraph tags -->
+<xsl:template match="miejsce_czas">
+<xsl:text>
+
+
+
+</xsl:text>
+<xsl:apply-templates mode="inline" />
+</xsl:template>
+
+<xsl:template match="didaskalia">
+<xsl:variable name="content">
+    <xsl:apply-templates select="*|text()" mode="inline" />
+</xsl:variable>
+<xsl:text>
+
+/ </xsl:text><xsl:value-of select="wl:wrap_words(wl:strip($content))" /><xsl:text> /</xsl:text>
+</xsl:template>
+
+<xsl:template match="lista_osoba">
+<xsl:text>
+ * </xsl:text>
+<xsl:apply-templates mode="inline" />
+</xsl:template>
+
+<xsl:template match="akap|akap_dialog|akap_cd">
+<xsl:variable name="content">
+    <xsl:apply-templates select="*|text()" mode="inline" />
+</xsl:variable>
+<xsl:text>
+
+</xsl:text>
+<xsl:value-of select="wl:wrap_words(wl:strip($content))" />
+</xsl:template>
+
+<xsl:template match="strofa">
+<xsl:text>
+</xsl:text>
+    <xsl:choose>
+        <xsl:when test="count(br) > 0">     
+            <xsl:call-template name="verse">
+                <xsl:with-param name="verse-content" select="br[1]/preceding-sibling::text() | br[1]/preceding-sibling::node()" />
+                <xsl:with-param name="verse-type" select="br[1]/preceding-sibling::*[name() = 'wers_wciety' or name() = 'wers_akap' or name() = 'wers_cd'][1]" />
+            </xsl:call-template>    
+            <xsl:for-each select="br">		
+    			<!-- Each BR tag "consumes" text after it -->
+                <xsl:variable name="lnum" select="count(preceding-sibling::br)" />
+                <xsl:call-template name="verse">
+                    <xsl:with-param name="verse-content" 
+                        select="following-sibling::text()[count(preceding-sibling::br) = $lnum+1] | following-sibling::node()[count(preceding-sibling::br) = $lnum+1]" />
+                    <xsl:with-param name="verse-type" select="following-sibling::*[count(preceding-sibling::br) = $lnum+1 and (name() = 'wers_wciety' or name() = 'wers_akap' or name() = 'wers_cd')][1]" />
+                </xsl:call-template>
+            </xsl:for-each>
+        </xsl:when>
+        <xsl:otherwise>
+            <xsl:call-template name="verse">
+                <xsl:with-param name="verse-content" select="text() | node()" />
+                <xsl:with-param name="verse-type" select="wers_wciety|wers_akap|wers_cd[1]" />
+             </xsl:call-template>           
+        </xsl:otherwise>
+    </xsl:choose>
+</xsl:template>
+
+<xsl:template name="verse">
+    <xsl:param name="verse-content" />
+    <xsl:param name="verse-type" />
+<xsl:text>
+</xsl:text>
+    <xsl:variable name="content">
+        <xsl:apply-templates select="$verse-content" mode="inline" />
+    </xsl:variable>
+    <xsl:choose>
+        <xsl:when test="name($verse-type) = 'wers_akap'">
+            <xsl:text>  </xsl:text>
+        </xsl:when>
+        <xsl:when test="name($verse-type) = 'wers_wciety'">
+            <xsl:choose>
+                <xsl:when test="$verse-content/@typ">
+                    <xsl:text>    </xsl:text>
+                </xsl:when>
+                <xsl:otherwise>
+                    <xsl:text>  </xsl:text>
+                </xsl:otherwise>
+            </xsl:choose>
+        </xsl:when>
+        <xsl:when test="name($verse-type) = 'wers_cd'">
+            <xsl:text>                        </xsl:text>
+        </xsl:when>
+    </xsl:choose>
+<xsl:value-of select="wl:strip($content)" />
+</xsl:template>
+
+<xsl:template match="motto_podpis">
+<xsl:apply-templates mode="inline" />
+</xsl:template>
+
+
+<!-- ================================================ -->
+<!-- = INLINE TAGS                                  = -->
+<!-- = (contain other inline tags and special tags) = -->
+<!-- ================================================ -->
+<!-- Annotations -->
+<xsl:template match="pa|pe|pr|pt" mode="inline" />
+
+<!-- Other inline tags -->
+<xsl:template match="mat" mode="inline"><xsl:apply-templates mode="inline" /></xsl:template>
+
+<xsl:template match="didask_tekst" mode="inline"><xsl:apply-templates mode="inline" /></xsl:template>
+
+<xsl:template match="slowo_obce" mode="inline"><xsl:apply-templates mode="inline" /></xsl:template>
+
+<xsl:template match="tytul_dziela" mode="inline">
+<xsl:if test="@typ = '1'">â</xsl:if><xsl:apply-templates mode="inline" /><xsl:if test="@typ = '1'">â</xsl:if>
+</xsl:template>
+
+<xsl:template match="wyroznienie" mode="inline">
+<xsl:text>*</xsl:text><xsl:apply-templates mode="inline" /><xsl:text>*</xsl:text>
+</xsl:template>
+
+<xsl:template match="osoba" mode="inline">
+<xsl:apply-templates mode="inline" />
+</xsl:template>
+
+
+<!-- ============================================== -->
+<!-- = STANDALONE TAGS                            = -->
+<!-- = (cannot contain any other tags)            = -->
+<!-- ============================================== -->
+<xsl:template match="sekcja_swiatlo">
+<xsl:text>
+
+
+
+</xsl:text>
+</xsl:template>
+
+<xsl:template match="sekcja_asterysk">
+<xsl:text>
+
+*
+
+</xsl:text>
+</xsl:template>
+
+<xsl:template match="separator_linia">
+<xsl:text>
+
+------------------------------------------------
+
+</xsl:text>
+</xsl:template>
+
+
+<!-- ================ -->
+<!-- = SPECIAL TAGS = -->
+<!-- ================ -->
+<!-- Themes -->
+<xsl:template match="begin" mode="inline" />
+
+<xsl:template match="end" mode="inline" />
+
+<xsl:template match="begin|end" />
+
+<xsl:template match="motyw" mode="inline" />
+
+
+<!-- ================ -->
+<!-- = IGNORED TAGS = -->
+<!-- ================ -->
+<xsl:template match="extra|uwaga" />
+<xsl:template match="extra|uwaga" mode="inline" />
+
+
+<!-- ======== -->
+<!-- = TEXT = -->
+<!-- ======== -->
+<xsl:template match="text()" />
+<xsl:template match="text()" mode="inline">
+    <xsl:value-of select="wl:substitute_entities(.)" />
+</xsl:template>
+
+
+</xsl:stylesheet>
+
diff --git a/librarian/dcparser.py b/librarian/dcparser.py
new file mode 100644
index 0000000..557509c
--- /dev/null
+++ b/librarian/dcparser.py
@@ -0,0 +1,197 @@
+# -*- coding: utf-8 -*-
+from xml.parsers.expat import ExpatError
+from datetime import date
+import time
+
+# Import ElementTree from anywhere
+try:
+    import xml.etree.ElementTree as etree # Python >= 2.5
+except ImportError:
+    try:
+        import elementtree.ElementTree as etree # effbot's pure Python module
+    except ImportError:
+        import lxml.etree as etree # ElementTree API using libxml2
+
+
+# ==============
+# = Converters =
+# ==============
+class Person(object):
+    """Single person with last name and a list of first names."""
+    def __init__(self, last_name, *first_names):
+        self.last_name = last_name
+        self.first_names = first_names
+    
+    
+    def __eq__(self, right):
+        return self.last_name == right.last_name and self.first_names == right.first_names
+    
+    
+    def __unicode__(self):
+        if len(self.first_names) > 0:
+            return '%s, %s' % (self.last_name, ' '.join(self.first_names))
+        else:
+            return self.last_name
+    
+    
+    def __repr__(self):
+        return 'Person(last_name=%r, first_names=*%r)' % (self.last_name, self.first_names)
+
+
+def str_to_unicode(value, previous):
+    return unicode(value)
+
+
+def str_to_unicode_list(value, previous):
+    if previous is None:
+        previous = []
+    previous.append(str_to_unicode(value, None))
+    return previous
+
+
+def str_to_person(value, previous):
+    comma_count = value.count(',')
+    
+    if comma_count == 0:
+        last_name, first_names = value, []
+    elif comma_count == 1:
+        last_name, first_names = value.split(',')
+        first_names = [name for name in first_names.split(' ') if len(name)]
+    else:
+        raise ValueError("value contains more than one comma: %r" % value)
+    
+    return Person(last_name.strip(), *first_names)
+
+
+def str_to_date(value, previous):
+    try:
+        t = time.strptime(value, '%Y-%m-%d')
+    except ValueError:
+        t = time.strptime(value, '%Y')
+    return date(t[0], t[1], t[2])
+
+
+# ==========
+# = Parser =
+# ==========
+class ParseError(Exception):
+    def __init__(self, message):
+        super(ParseError, self).__init__(message)
+
+
+class XMLNamespace(object):
+    '''Represents XML namespace.'''
+    
+    def __init__(self, uri):
+        self.uri = uri
+
+    def __call__(self, tag):
+        return '{%s}%s' % (self.uri, tag)
+
+    def __contains__(self, tag):
+        return tag.startswith(str(self))
+
+    def __repr__(self):
+        return 'XMLNamespace(%r)' % self.uri
+    
+    def __str__(self):
+        return '%s' % self.uri
+
+
+class BookInfo(object):
+    RDF = XMLNamespace('http://www.w3.org/1999/02/22-rdf-syntax-ns#')
+    DC = XMLNamespace('http://purl.org/dc/elements/1.1/')
+    
+    mapping = {
+        DC('creator')        : ('author', str_to_person),
+        DC('title')          : ('title', str_to_unicode),
+        DC('subject.period') : ('epoch', str_to_unicode),
+        DC('subject.type')   : ('kind', str_to_unicode),
+        DC('subject.genre')  : ('genre', str_to_unicode),
+        DC('date')           : ('created_at', str_to_date),
+        DC('date.pd')        : ('released_to_public_domain_at', str_to_date),
+        DC('contributor.translator') : ('translator', str_to_person),
+        DC('contributor.technical_editor') : ('technical_editor', str_to_person),
+        DC('publisher')      : ('publisher', str_to_unicode),
+        DC('source')         : ('source_name', str_to_unicode),
+        DC('source.URL')     : ('source_url', str_to_unicode),
+        DC('identifier.url') : ('url', str_to_unicode),
+        DC('relation.hasPart') : ('parts', str_to_unicode_list),
+        DC('rights.license') : ('license', str_to_unicode),
+        DC('rights')         : ('license_description', str_to_unicode), 
+    }
+
+    @classmethod
+    def from_string(cls, xml):
+        from StringIO import StringIO
+        return cls.from_file(StringIO(xml))
+    
+    @classmethod
+    def from_file(cls, xml_file):
+        book_info = cls()
+        
+        try:
+            tree = etree.parse(xml_file)
+        except ExpatError, e:
+            raise ParseError(e)
+
+        description = tree.find('//' + book_info.RDF('Description'))
+        book_info.wiki_url = description.get(cls.RDF('about'), None)
+        
+        if description is None:
+            raise ParseError('no Description tag found in document')
+        
+        for element in description.findall('*'):
+            book_info.parse_element(element) 
+        
+        return book_info
+
+    def parse_element(self, element):
+        try:
+            attribute, converter = self.mapping[element.tag]
+            setattr(self, attribute, converter(element.text, getattr(self, attribute, None)))
+        except KeyError:
+            pass
+
+    def to_xml(self):
+        """XML representation of this object."""
+        etree._namespace_map[str(self.RDF)] = 'rdf'
+        etree._namespace_map[str(self.DC)] = 'dc'
+        
+        root = etree.Element(self.RDF('RDF'))
+        description = etree.SubElement(root, self.RDF('Description'))
+        
+        if self.wiki_url:
+            description.set(self.RDF('about'), self.wiki_url)
+        
+        for tag, (attribute, converter) in self.mapping.iteritems():
+            if hasattr(self, attribute):
+                e = etree.Element(tag)
+                e.text = unicode(getattr(self, attribute))
+                description.append(e)
+        
+        return unicode(etree.tostring(root, 'utf-8'), 'utf-8')
+
+    def to_dict(self):
+        etree._namespace_map[str(self.RDF)] = 'rdf'
+        etree._namespace_map[str(self.DC)] = 'dc'
+        
+        result = {'about': self.wiki_url}
+        for tag, (attribute, converter) in self.mapping.iteritems():
+            if hasattr(self, attribute):
+                result[attribute] = unicode(getattr(self, attribute))
+        
+        return result
+
+
+def parse(file_name):
+    return BookInfo.from_file(file_name)
+
+
+if __name__ == '__main__':
+    import sys
+    
+    info = parse(sys.argv[1])
+    for attribute, _ in BookInfo.mapping.values():
+        print '%s: %r' % (attribute, getattr(info, attribute, None))
+
diff --git a/librarian/dcparser.pyc b/librarian/dcparser.pyc
new file mode 100644
index 0000000000000000000000000000000000000000..0e911b8d97be8a856f2b1d6fcbfb500ab12c811a
GIT binary patch
literal 8696
zcmcIpTXPi074Df`t+YZ{1S@1?vKTgz9kgpms$x4hq%hdV7a5OiV`T7Tw9}GCTFore
zy+}$RRS7)iAuoAwRo?UHO64&Rsmf2vA4tCM^y~#(NySxb!Swc=zMu1*)90M|+rMU~
z{}Eq*zpaYDdHntok9q1T7306B_Lb^*YSU95-+i_3t4>L6mfU+u?U&VNSsmA;J6<PL
zQc=mI+N`KM=?AK;r_|oG%C0F7f5%JxZq<ID2Y(#&sYxF$gL$So4<<po_eJWXh|5Z!
zP}`o0C)87=o+x#9b4JA#zHH8_cv32JDxQ+cyo#$*Sy1t`(u*?k1SvA|q>5+y^UV&Z
z*xy{AIzOPEQt^UJby{g0bW!d3D*I}{fn~M1tTft|RdPnfC)LUmaBM{#T~+#&N?uUO
zi(K=@{U51&zS=yiHeXWllG10DKBx2wD>(6!lG^rF?cMhteB#|n$?uZdSUm-4B>%?W
zDkP%pG>V%?-N@d|^DK9?GH7vR^}4N~c3bBrO9v9=sOxyl6%-nb0{c+<6fOByqD)yS
za}TUcsJJYZiV8MXCph+JC^nLGr=#m#nZACQ*xh<3GPa&Z2f7}maXqSc61->I_3b1t
z8ceh8V{8czf8WJpYA7Cg>XA|*D!x=?QyX%e^;Pz?RTP{*<oxyo-egvJHLIM^mQfhp
z*$(&?@NE^3E6g?2TAvy0w)N}Ymd;zZ^K4J=+vC<@)=6~-)n0zw>~>n6WQ$K8<w=yb
z;&wO6F|64=wo{lR43jjmVR#yK!!?vw_2f|8CZD(Qm<uRyqC}2{k^osy9!WT=#}cH`
z6OQbfvjk+cWsxU4yLQYcAuz&FKM2DYP%~Umd2M2Y5053MxQ>c-2k{gz42<lRRdya&
z6gee;O-UssIjZy^VmHz$cTyZM22fTx-#VCpmAG)jT&g#W<w|vFvlLiIry?`qgUE6(
zOHzS=@M6pyAcDfMmnQ8j)?s)Kud+Gi)x7imfEC=Cu!4Gr;}<d&G0Is5o$IE7W~XVZ
z1C+ki$S*nUJCwflY9oI|`j5z(T=+iD=dhaVZXSl*Tp{DtNz@A<Q<K6_Oh_0WWO1*<
zS9S=)IBSPtKxqY>DVSj~i()7Ssf|Og0>W<zkD)cIconZYQ7u;|zpYhlcX$LC`^rNO
z%B~AxI(tFQc^GwiS`ORI^}{6Vnc?oov2i<xMU2fuoAr_O3Mqv;@rTbqoi5`Ax(}V$
zn^M`d@^+MZ>?zuIXA-Pv722QpR5w!lrz8+XE7r4Ai(!wtU7f}Of$2bX619MQ9P=qf
zG|!weq-9^jN@fa$@@BnhsEx>r@FDL-Y5t0e(-^1@4)hr3gURs494?BH01N!bCH1(h
z(i{XaC^VLzN-NBy8;N_;^+Nyh;|cYsOcRQW3A5g~e@;EFC^E0Y_v{45qDw`ce9%@N
zp5IQ$0$35I2HpbpR71z#dt~V&Sg;B81UoIOKak->{koW^OJcOJ5ExrUVSb20P*rbd
zsg07<)DN;;*X?eU)*%>>4-TR?>y2Dy5&PZFda0F~>2?wu2#8sHPI$__EgImu*gWZq
zk_H2D%55hThcegDdI%uGFE8Jh3iWx+qNm0e0CyMtPf1unp}cv2)?0+=PkYz=1z&_u
zkP;Ch{7qEg20~xKKyaLbgcN<afelrLwCDz|h>JJu1Kdj=aqu842Z$B^l$HEUz?-5Y
zBvKOmHSVr84%Qm6=w0LPP-eKEpbS($;g3z=IdFS8QI{{li+BkrU2z~rI4(A2%)I1{
zQ}B}B*>%1W2FfczdFH%jPfYP`x*LLuHXHfJ-AMOER5V;Nu^~@U@#&JWS=i6xQUt<&
zUhLp2a17pqsbB`o2~bbJ{TZu5bu~T6H)x<HM&B6}Hi%_C(8feNV+NNjw9d7;Z{;}|
z(4+<oJKR3lGF~~zAwR;jvTVh(yxP9_=)-krkLgBj{cX1Y96bhX|36)27n5vGQb2^N
zSwRutI@U&~*3_}0xXQAm^NPs^J|aG99^?ht!7Cn-m>`ov?&Zl)N&)YkG4qML{tVCa
z*BKX=EfS4Gm&lW7WkdF~F0RyX8s>4sI1f(t$HO_lmUGx>XS_Qu+?saO>4f1ISmD3!
zoHrV8+<|(CV)T`Q+Z0taHp;DGXd@mfly`*VucFtO_fI5-u<`C@3Bxb(-aiB7&SwA+
znv((dYkj`cG>?LLl`bd8IfO`!YCYbai)Z*1ru~k)<zb#d$oI6r!l|Y84Wr>USEo=9
zh8Bm+6SEWin6)Mg>S54AG31!k#^FB(oGHL#D0w)(ezoNO36!sA+5W9`J8Pp+{wTQX
zc+5B8lQT#f7bDC&(hDWUx&Rrm`!3uh_*r^_TIp*E=F#hF8P}+;42a@CfjBWr6ekMA
z$x-4I7Xh(4N}Mi;CzPHX%sEpKXGe*11#y0KOA7^Yag=znAR-?!+~-n3JT*!@T@Y)d
z#N~o`W|X*65MNNpKJ^)b9E_X@S(o8LFBL@OVTQyX2yqifpH^|5xeziOhsNvq{wp$1
zFSE|f(*>y@^K?-v^SlHa6dZB2Yi;+<R_pNauzC2CW|r@?F2C`{8?D!_w60uP%j4}e
za|{D;w3eC+ratW7?d2Wm9k*LZR~+ybX<cq!Zn<EfXLqw)aNf>!WKkztY+^fFYPy@X
zcMY*_dRu$CZJW68lPng`Xg^6~!C=459(Uca9i8IF5;w3ICKNG`vXG9$$chhT&tmc%
zTZ;^c2#LDAtxnQLD0u)!8NCc+1G+xVZY&enJW5T6o0TLG4PTyY_3+*tHd$(=)$Lt`
z>QN`ual-yw>zV$~b&!0KY{2a5Ts&x#_42lM`6IcJ<=q*2*8~oWN9KAqKMOt-yH7G1
zm&D+CvYj9q1d?zSxgl%BAI8BWn`CKoH!^VHtcU`~*QwDmTGBYCS&%HRprRhe+O*;J
zbGQi8brqM67iAfbT(}odfrdk`_c0i;BeI}y5a?d_ojU+?Lma8~ktE?1#%+ML>CUZ>
z-3@jF6k*YJo*jhSNk_XB8kcK#j2!#upcAm4m^&%PVe?$-j;q2NV@KG3kw^0vh7lx@
zB1irwD(Lb=4vTDY5h;k7LqK>ZJwFH~P9u~+7|9S1ksKI-@J_-A26!-l!X-p{U>_Qn
z@i2~*^fZ}>2IO4Dvxc_}hK5sYja{&g+#TkP2lK*>KDsEQs|+YH?#BHkMxhv(Oc#Nu
z_uwz;4ha2Vh1XrHB^<ahB62Efw3YR&xrkbt)khlZ@RI7=h#=#7lGc%x=~3||IDK`M
zE`U>Rn`@`9lC0#FqQuV??cRoVi$sGP@5t|twgK~(a?2bh`$<SVljrOT_sLS>WvZ|+
zH7+E5r#}eT5Yz~Uws21&E4rPzD2rR+J?^r!quAyO{rOOJ$QlQzf}5D_cX$k=9_3g4
zlDFh7c#Hm7?;OI^1%Cn8>!J%%%jm)TR`7KXmE-G#7@R@6gq~WtClM&n<<c<_AP~eh
zP>?P_KX>T@E`Sm~eB4QwfWnFdw38Chy6+RiIEyD21|J}61Jnof9))1EjjYWb>-3Sc
z8xRnQLm_>jk6nVFn->>4xXT%;DA<!$Q_CBS;zJlbosU;-gAJ_oCp;q|>m>xOZAzM_
zqeT^tE`S1EbBgLX2*yD{u0rvip*rV-B+1C2m(xJ>MOKV-sFQ?1Y?9t!ICDs7np9a`
z@<j>M6z`JP!ARGJejd|mNBcs+$0fKb{Nl37FD?)*%Q6iBw2>0U>_|Gj4lQ@vksULs
zG^3ylgC1O<qQW^*^Z9|Ae~m2D*Xj;CWB3Ahjn7b+(UlvbJ?3Swh+!X-vJwT#g~1Ob
zb~iEg%w5Z(p>PAhIxw;we2kyq7K`^$7#fS7-ClcrmEl+LAqq)Dx)d|x*AN&B*4W6Q
zGR=**1#35*+aOooMsKTl4L)JF5(;23VAe)}lmJ6`4vY-NttN<+Men0eaE}GQ-G~*j
znKS3kPKfJ4sODK_1BPM(_yD1-3Vy}n4vO(2RBldq9WYIQ#^i-1sChO2jQ65H?bTre
zPQoV4duP1UF2T=j@)6t;+}{PaySSKv3t-m=Y_9^bN4EuR^0iaIc1>XB7mx$qz$!vX
z3`h17z*c3TIUo^T_>b8htOHT&xIB2BlacE|gfiG-K^%zf7wHFW(gyMlV!l$OBFX^U
zQ~_+83I?K+Z+I>ar`7_Cy^eiOKx3AT*uN}{leYZ^OBNYK3I`$)v7Gl;CH$hJ<?=t=
zf<wO?sm|9^EH1KGW+7nZE!f6K7lZ8HZWagcvE?QU+N=P6k_u83!y`#;Ecec9m{;R5
ztW>-iZ^kbpA^N}mEtlpe=1)~8t4nR#PCnFh!62_)S`aZ~K*MN8BH$8oE{W$wN9nkU
z;t$U@mScT{rT&hm2<Jt^@rj6Te2C4Vfxu}PNp#mywFDP5uPIJLZkn3kq{R=B!Swni
z<I2Iod5)k1!V#LjOS7;=pQ7$;8l^fy6sPIdK^Jk2T!fbL*M&WMZUV7yox$8<7@TpH
zJi7yt;HQpB1Wv-un@4RePPog1lBbU8WQU{)oRvH_a$86F&O@ot^>I)nSLE}65mP5_
zP#B20<Z*{m8XE#70e;ney!!=lBuHF<otr7Sv@$)RId7#>tMQv!b*_4%Hc?xueO@ik
L0<G|p)QtBZbHfps

literal 0
HcmV?d00001

diff --git a/librarian/html.py b/librarian/html.py
new file mode 100644
index 0000000..b279e5d
--- /dev/null
+++ b/librarian/html.py
@@ -0,0 +1,242 @@
+# -*- coding: utf-8 -*-
+import os
+import cStringIO
+import re
+import copy
+import pkgutil
+
+from lxml import etree
+
+
+ENTITY_SUBSTITUTIONS = [
+    (u'---', u'â'),
+    (u'--', u'â'),
+    (u'...', u'â¦'),
+    (u',,', u'â'),
+    (u'"', u'â'),
+]
+
+
+def substitute_entities(context, text):
+    """XPath extension function converting all entites in passed text."""
+    if isinstance(text, list):
+        text = ''.join(text)
+    for entity, substitutution in ENTITY_SUBSTITUTIONS:
+        text = text.replace(entity, substitutution)
+    return text
+
+
+# Register substitute_entities function with lxml
+ns = etree.FunctionNamespace('http://wolnelektury.pl/functions')
+ns['substitute_entities'] = substitute_entities
+
+
+def transform(input_filename, output_filename):
+    """Transforms file input_filename in XML to output_filename in XHTML."""
+    # Parse XSLT
+    style_filename = os.path.join(os.path.dirname(__file__), 'book2html.xslt')
+    style = etree.parse(style_filename)
+
+    doc_file = cStringIO.StringIO()
+    expr = re.compile(r'/\s', re.MULTILINE | re.UNICODE);
+
+    f = open(input_filename, 'r')
+    for line in f:
+        line = line.decode('utf-8')
+        line = expr.sub(u'<br/>\n', line)
+        doc_file.write(line.encode('utf-8'))
+    f.close()
+
+    doc_file.seek(0);
+
+    parser = etree.XMLParser(remove_blank_text=True)
+    doc = etree.parse(doc_file, parser)
+
+    result = doc.xslt(style)
+    if result.find('//p') is not None:
+        add_anchors(result.getroot())
+        add_table_of_contents(result.getroot())
+        result.write(output_filename, xml_declaration=False, pretty_print=True, encoding='utf-8')
+        return True
+    else:
+        return False
+
+
+class Fragment(object):
+    def __init__(self, id, themes):
+        super(Fragment, self).__init__()
+        self.id = id
+        self.themes = themes
+        self.events = []
+
+    def append(self, event, element):
+        self.events.append((event, element))
+
+    def closed_events(self):
+        stack = []
+        for event, element in self.events:
+            if event == 'start':
+                stack.append(('end', element))
+            elif event == 'end':
+                try:
+                    stack.pop()
+                except IndexError:
+                    print 'CLOSED NON-OPEN TAG:', element
+
+        stack.reverse()
+        return self.events + stack
+
+    def to_string(self):
+        result = []
+        for event, element in self.closed_events():
+            if event == 'start':
+                result.append(u'<%s %s>' % (element.tag, ' '.join('%s="%s"' % (k, v) for k, v in element.attrib.items())))
+                if element.text:
+                    result.append(element.text)
+            elif event == 'end':
+                result.append(u'</%s>' % element.tag)
+                if element.tail:
+                    result.append(element.tail)
+            else:
+                result.append(element)
+
+        return ''.join(result)
+
+    def __unicode__(self):
+        return self.to_string()
+
+
+def extract_fragments(input_filename):
+    """Extracts theme fragments from input_filename."""
+    open_fragments = {}
+    closed_fragments = {}
+
+    for event, element in etree.iterparse(input_filename, events=('start', 'end')):
+        # Process begin and end elements
+        if element.get('class', '') in ('theme-begin', 'theme-end'):
+            if not event == 'end': continue # Process elements only once, on end event
+
+            # Open new fragment
+            if element.get('class', '') == 'theme-begin':
+                fragment = Fragment(id=element.get('fid'), themes=element.text)
+
+                # Append parents
+                if element.getparent().get('id', None) != 'book-text':
+                    parents = [element.getparent()]
+                    while parents[-1].getparent().get('id', None) != 'book-text':
+                        parents.append(parents[-1].getparent())
+
+                    parents.reverse()
+                    for parent in parents:
+                        fragment.append('start', parent)
+
+                open_fragments[fragment.id] = fragment
+
+            # Close existing fragment
+            else:
+                try:
+                    fragment = open_fragments[element.get('fid')]
+                except KeyError:
+                    print '%s:closed not open fragment #%s' % (input_filename, element.get('fid'))
+                else:
+                    closed_fragments[fragment.id] = fragment
+                    del open_fragments[fragment.id]
+
+            # Append element tail to lost_text (we don't want to lose any text)
+            if element.tail:
+                for fragment_id in open_fragments:
+                    open_fragments[fragment_id].append('text', element.tail)
+
+
+        # Process all elements except begin and end
+        else:
+            # Omit annotation tags
+            if len(element.get('name', '')) or element.get('class', '') == 'annotation':
+                if event == 'end' and element.tail:
+                    for fragment_id in open_fragments:
+                        open_fragments[fragment_id].append('text', element.tail)
+            else:
+                for fragment_id in open_fragments:
+                    open_fragments[fragment_id].append(event, copy.copy(element))
+
+    return closed_fragments, open_fragments
+
+
+def add_anchor(element, prefix, with_link=True, with_target=True, link_text=None):
+    if with_link:
+        if link_text is None:
+            link_text = prefix
+        anchor = etree.Element('a', href='#%s' % prefix)
+        anchor.set('class', 'anchor')
+        anchor.text = unicode(link_text)
+        if element.text:
+            anchor.tail = element.text
+            element.text = u''
+        element.insert(0, anchor)
+    
+    if with_target:
+        anchor_target = etree.Element('a', name='%s' % prefix)
+        anchor_target.set('class', 'target')
+        anchor_target.text = u' '
+        if element.text:
+            anchor_target.tail = element.text
+            element.text = u''
+        element.insert(0, anchor_target)
+
+
+def any_ancestor(element, test):
+    for ancestor in element.iterancestors():
+        if test(ancestor):
+            return True
+    return False
+
+
+def add_anchors(root):
+    counter = 1
+    for element in root.iterdescendants():
+        if any_ancestor(element, lambda e: e.get('class') in ('note', 'motto', 'motto_podpis', 'dedication')
+        or e.tag == 'blockquote'):
+            continue
+        
+        if element.tag == 'p' and 'verse' in element.get('class', ''):
+            if counter == 1 or counter % 5 == 0:
+                add_anchor(element, "f%d" % counter, link_text=counter)
+            counter += 1
+        elif 'paragraph' in element.get('class', ''):
+            add_anchor(element, "f%d" % counter, link_text=counter)
+            counter += 1
+
+
+def add_table_of_contents(root):
+    sections = []
+    counter = 1
+    for element in root.iterdescendants():
+        if element.tag in ('h2', 'h3'):
+            if any_ancestor(element, lambda e: e.get('id') in ('footnotes',) or e.get('class') in ('person-list',)):
+                continue
+            
+            if element.tag == 'h3' and len(sections) and sections[-1][1] == 'h2':
+                sections[-1][3].append((counter, element.tag, ''.join(element.xpath('text()')), []))
+            else:
+                sections.append((counter, element.tag, ''.join(element.xpath('text()')), []))
+            add_anchor(element, "s%d" % counter, with_link=False)
+            counter += 1
+    
+    toc = etree.Element('div')
+    toc.set('id', 'toc')
+    toc_header = etree.SubElement(toc, 'h2')
+    toc_header.text = u'Spis treÅci'
+    toc_list = etree.SubElement(toc, 'ol')
+
+    for n, section, text, subsections in sections:
+        section_element = etree.SubElement(toc_list, 'li')
+        add_anchor(section_element, "s%d" % n, with_target=False, link_text=text)
+        
+        if len(subsections):
+            subsection_list = etree.SubElement(section_element, 'ol')
+            for n, subsection, text, _ in subsections:
+                subsection_element = etree.SubElement(subsection_list, 'li')
+                add_anchor(subsection_element, "s%d" % n, with_target=False, link_text=text)
+    
+    root.insert(0, toc)
+
diff --git a/librarian/html.pyc b/librarian/html.pyc
new file mode 100644
index 0000000000000000000000000000000000000000..dfb837db2bd1077d904719c9d591cb02dd42d5bc
GIT binary patch
literal 8882
zcmb_iU2GiJb-pu8F1ag`qDY!DEj!vsp}n$2GF4IAP-(@sC`&>lN}ZKTnH95H?hMHx
zmov+`vl5v~K@hqr`c@zT`cNcq$#c=X1n5%>B#$jx6etP=C{UmeeJarRqW!+_?k*|C
zE)bZa=JNjEbMHClJLlZXpa1u0`O&|<dAn)4|3>ipLwxqvNJ9Mg%#Jau{k&&Zy<WX<
zR{dVSU{(vg{D4^<P~JB?gQit9t3~65ubObigs++KoC#kyn}cR`$b_TjGt540qN0gQ
zCLA+|SfFeo)Rawl+AN0S>T$}1XG}C=Hn8{vYYvV1bam8(lWHC_(P{n%wc(Wc48)u<
z;VWvIFyXW^lO{Z?%oMxTs&8O}@&DrAa@9jNA4C%6Srl~&$j!~o>G!{X??)Y9<!<qZ
z`aM5C-!1=4&6h8Ci$CdbvJ2hPkDDAj(EYCCx4n-fH|CjVa?c$4CY{9DcqaB)h21~*
zOyU`D|4ow@%+lId%wyj?$NvJ`;{o#w9Sa<Yj(cyL71Y+MT*ZC^$)o#?e5(@e=TTzg
zG^uQKl4j0KGfkdESso{wl}4*oiIP0dBU_1+O1oig6jpK!ng?OVRCyA48A)v8#O95p
z8RgtVE4H~Z+i9HSQ>eMI{NVP3PwTaZAJ>q1_~7=v<yt<3hAe8g8qKK6VXDCTTtUN?
zDWXMG9OPrj+RnNKNge!v+$w5}61#}p!b2NncHujn^(b4opQYQ;PJXcPG;JkO3)xO~
zFt-`!3$1vaU)IRtMzXM#@3!XK2l?dj*`vDFj3Z0(Ev4P~<KCn<WJbJc&sI?0%JcTs
zg%_ruZ?_hDM`?po=p@E6!*dd2zXitQ{9^I4n<*G<7)%9&$uXZ&78l7wavH5eCLX3N
zKOZo8$;6O(^g-s7(h>79hYgy1)I5U<I=&ap{tff22;um^JRdU8Fvpk)wGN9|0g5ol
zdJaa-fQiS|4N9SISlru7AUn{y2`=xk4-}+Gx;zpIB^fgLD`@nd5BJE1^nqGTS~AZ-
z<g_Fa8!4M-WfPw@AzHE75wl$~=}k;DqlVYGgeE@sVws~r8HSWh{<;avTrq^MlgfgJ
zLM<7@G_RW)CaqORan|-@BoDGiVmH!k*H$*-Rs=C_ck(*3Nn@AA%A>n?DtTH-JNa+4
z+<I{L&b+12t*7bE70JoIZRNIrs)ffEdI<rx)PhdFG53ClqPn=AEnF+d$eH{Mk}TRy
zpG5WbRwLP|Q=r}Gg?4@#t^2#JdKfiZjjTa&&M9Z@EXwnPdOL&e<in_ll4cr0A(sV3
zIdwR-Qjj*3IOwZR7-!s-#?-aRdObjA2U+b#W+R9UM6#A+?#<ix)U#jUyjYrA*-Ura
zI3xAG`|!?#+jnj+-%!iL<=fZqE#1)SX&XAiJ!1!H7y*W)o&w0H8DK+=qCQe(vz3Ab
z(rY8ABWc0$-zQ<2svl$>*Un>B%|@Jr$}Fczlv9ryVOR&!Y^9kMMVr9lG|eFct}Sn@
zx1xHwQ5TXVxz*C2G+H*Qa=cLFML7^FUXlO@Hu(YO>WPacvaHg<g=tewA}`u+XOf2v
z6<aZ=<<aQWGaU{3t163Zr<I>1a`7PZo}^zu!M=^e6u#=6_D8(e{nJ3LqIcSx@Lu!E
z{-{6UO`vYt8^_OiZ`jv%KFJ!JyI^ROL-~)=O&zkoha`gah58v8Mi_HX8CY^(8JO{c
zGK18~&(OJOf|?9OlVZ{Pu5-RCNPv4dE?^Z<0w(Q{(4ul3_6wHFnEHU(g!w}Ta~dc$
z=~=GwP#q&W?I;W0XOT)$ug6K8*XvS`IMhk!ThVT0ofJO7)@+q@h(R`LZ3MrMQm}~R
z1ep<B#e6z8Qe|K<O8EKBLwF61*c^ZYhJai5&4$q4JGNP>WbgqJ?V-_z!iCyHaE+Dn
zM7S|20!$qFcanRdr*I3OB_YOZk_7|!$ON(SFOUJ3;9~3_bhop#mK<|MBr4nRUe1ca
z*efIkeo1$)d*i4^AK$Rg?-=i3Ozw-5h?TwXngQs}cG;xph<}i>n;3ob7FxVV9F32z
z4ICcHkWLikvo*OC%UzvqWVv(@=O=@H{m#AGjit)+z2&)k_irp$9(;83s-#t?9dO_3
z-%i_daBe4Iw0|SZ(o9F4Mevb;Cp?QIR=@*l?gSsQ?js~8$OxEqfHKiDtYc|N@;6ao
zUqxcPqF07bGU}bhSMbL0Gwqj;ctt!Hul@s>F0cNf%PSn&(%RpC9=jgB$S$ZTjy{II
zOS{1W9C$p)Ghc$i#(yw$nx>mgMUzhT#=A0G_Wl_koLKUEQ2c(k*9rav`yHEN=%p#(
zqa2?C42R0V&0*!FS%D7%;=p%Q)T-3H<$y}q;qDh_ZDrP86FgU%l;HwC^3L+Rgk=8$
zPh{<!jslJfNR;dCv~v0ny}cq9>3h(eb=H1xVb)$)c5LR1f}Z)WYn>gXPfkz<EKz=O
zGfHS`uC1X!>P>JRNry<VxPVOt+@1~~xW(4KB<GDy=P6Kk8#z3Hb?FAo^sWtfV#39|
z5x0)SI(V0Je8}XaC0aHsty{SwpJD||M5Hv2N}AvG%HFGx=qdj8&-mgSH^+~Awsfc+
zf*u~32et-(fJEj(x_N>;kONY$caoS64@?f}aM)O-Omr;~y)alJ5?HVAreOz8L|ukK
z{BWEhkpbPaBl?v4(t(U@BH5)ADte`2sZbg#jq3z?>}0l1@XtZ|me8B2Z}y-1E*`<L
zLf8>WA9~)>+PD43aODe(J?Q>JH(>6e`^Zd~Z7BPXJgPka0wCTVf<|6YX!>&JqLlt0
z;iseXaBr>>brv2ydlSTcgfYwuT)5aUgLf`=%4`=*`aOU~uXz)yiYVtBjB?=k&wSya
za~Ome1~Ja@j#${+`<3w&-zdED2n39nrWFt&zQNrC43<J9Z*SULVa$!ti545JC9{~U
z!D^jVg*zN=Xa>7jN#23^D$9JGcjimsS@&GjkFa_3Rx$%?##ynHo3%gx2kd>yq?Zxu
zU*alDYi}4tTI?{49fLlYO!dJTd3%5Dt?Yf@Cks486Wyg0=b;%JZeyu#ZJ&$dVhrN2
zJ{MC$^KZBCJAQxR{dXLp7hfb4v%`?ZI0F}4lH5PSs0*;**tl#+tvW@?okMbCA3kj}
zw-vc@m5r`{ibyU?cVCL+=AGRp<O>i5Z3wHZ6(CwU{`3at)}u|_RS11lhDRVjQ09Ik
z4&@K3ok8CmBQ{<B*z=fs)?Rg1xRRuKh4D|HtjfjNV=$^XjQZb5&{MIUyL%x}!%xUu
z7)W=H@bUlCw_Ifm>LNK34#>`2G*>_g@sBj#VL01SgJyUM!CM?h6A*mDg#NA|>YLGl
zoS8tEOq>M)vGBi{whyYDB)H7ZT$tOe_fJ0`M^)Dq=~o_^2u<Ism#^eVabCE~3q^Z<
z>TxL8Q}U&;Pa!v0M!`9vc^4$xTS$yw^ostp8S!Vlsltr+)xvp%MQ<WRDl0^Sp&2N^
zks9;f@JGFJ!PQ<YUO^p0sEa<+S-(j(67cz3Q0l?(K#0>HNN?agY!92Xi~<m9Kxhbu
zfM_NM7*L4@_)8wa4jM1V%3-PpJ~#zI17aVVxIvRrZIxp!Knxy}LL=c38h``3(;*0`
z4p12b1Ny51MsXX{T@|ANhi=s}!PNu0qU!V3L+ux?hkKyzdf0NU%Ik||c|HwE(^eL3
z=)Qx>@eqwJj#2d9L6PAPL~R9$%;>BW6X*wISQn%f=gUZt*;gWU!$mq$SzIWnu4|K}
z1x~E#=s?wRwIJIp4@T?bf@LG#*Y(5GINz!xSl^LMs^k_|D;soY6Tm(ayQt5+d8oTi
zCn>lBi~iNdPqCE!8WQ6T!3ipRGYHjB<2N1sDSt@iQn%bBgiwk3NgBV746TI@_>fNi
zIofw{A2JFfkPb^SYI~!A;8C*z&$Sm{a}Mp4D8n0Fo8zV>AT7Z=NL=_y_rm#$XqV3S
zx}M~jP@Edc0k3;R#^0bUr^diZgrkVlXwu;$&Ha${KT&{|F(m!<@e}xaU90K@+@%F1
zH>I;O>6{haLpUEM{WkPLH|SImTt7(6>FLl$LW4bdI%iyA$V|gWVf+d&gUSmncbZ18
zh8Mb?(?|_`kJs_M%7?yT$(QDz{lXdCvc1uYdHNcMSO}QRgdZ`fhR<F^;zR(-39e%s
z*h3pUXD!N#!fH-Cq@4p80ej_c>vnOemg+`Qxq3Sd+ql@LpoUQxH{FdTi|ehlxwF^7
zKo>gfqb@jL@*O6Bj6`NGSY`1pizHM)5uK#K3}e>CR%3TPY+U;#@&c7<f*@|<<P#`v
z7Zk}c0J3&LNHDcA8wPu*k@mw_H8!(Gd&|9Z@Vb^d5k|HNyWKz#9y~>z_TzTOfb8gs
zNw<<T63w)OH;wG1L#Ti!_jmaE_W)FiNq@+{<bB0E2O~BEvn8>h&87=<oxR@zTx`ng
zr<%a)|DWS(@?UyELNE^bn38w@uaHS#hm6H%y0DYl%s91iJ>~kRkI}Oig{SwNb_|*s
zEHl%+;kkNLS%mW{Wx>o`3=uqx9r7?XdLDqpg3Jy1ie9pyk-x<VSOwAyO@xch7X!XX
zAW)GFeh>TJgGt4=0%r3)<rGz<8{*()VT5mvG;VB`BaJPf41-OF8%B7v`}6{1jR#0J
zAr$!qHGXOBugv2CMi6k+@dko-kM1nk+qk;o-3Ihw9nePrIYasoPT{%a(D!wWu**Q|
z^*#mY?3NiZ`*-<1vb6S5Z<$doGuB%M#JgoqYZ<uzpTErBuMjQNJrCasF#*p*lX5=j
z5D;Eofxs*aUUa#!b;bSqT}c(Sil#?ka|xLjz-B;T!}}g-7*EeZP7(7Gt(`kcUvmTZ
z_k<niBgh%X-L6fOIld&iNd8aJPr1);CbGDW&zZyLk}vI12H(Y0|AJ4qEeZty+Mu4h
zx7-Iqgz6>XhXsD5tYVKaesUC9<Y}`*b5;X{R`7WI%fD>KI?J@BU#&Q3qgm)9r^o^3
zpRn!+NUDUN;QLI7pALC=3FO>+0=MvOUr$1$Rn}TTL$J-_4!aPoYn}D31Ld40ddF2F
zL~zJ1#84aQG1vyscX#y@{2ALg96PCRMU4=C6}z&i_g<byB3G<C+65$p9lqIiXVg<m
zw@~liSi8D@A2%JBIvOVgujdmlRQAT7B)8wj3jf4a_^`m+DBedE;e6rc*T3Rj_2+@9
zd_5V*Yf1^ZA%oWxg$ol15tzT^i+6h2KlaxFu9EuF|BHbi9(6qScLGNpkN#M|)$xe?
ze=#844EV$tOf%tSaPTc8;z4_76A$Dq`DiV?GCDz^wbQG#;-pWyZ~n`;uCi^s!b=hp
z8@$I^DB9`zHu&bk%ZOvY#^fy~5;5679)G}dJK}?KUt0C-FeY7e_h;95aF+9q!0XeG
fKR!^vg*Sgn1En&&<3j2D^ySj~6Vs)k()j-YS#S+m

literal 0
HcmV?d00001

diff --git a/librarian/tests/__init__.py b/librarian/tests/__init__.py
new file mode 100644
index 0000000..3f02541
--- /dev/null
+++ b/librarian/tests/__init__.py
@@ -0,0 +1,115 @@
+# -*- coding: utf-8 -*-
+import unittest
+from os.path import dirname, join, realpath
+
+from lxml import etree
+from librarian import dcparser, html
+
+
+def test_file_path(dir_name, file_name):
+    return realpath(join(dirname(__file__), 'files', dir_name, file_name))
+
+
+class TestDCParser(unittest.TestCase):
+    KNOWN_RESULTS = (
+        ('dcparser', 'andersen_brzydkie_kaczatko.xml', {
+            'publisher': u'Fundacja Nowoczesna Polska',
+            'about': u'http://wiki.wolnepodreczniki.pl/Lektury:Andersen/Brzydkie_kaczÄtko',
+            'source_name': u'Andersen, Hans Christian (1805-1875), BaÅnie, Gebethner i Wolff, wyd. 7, KrakÃ³w, 1925',
+            'author': u'Andersen, Hans Christian',
+            'url': u'http://wolnelektury.pl/katalog/lektura/brzydkie-kaczatko',
+            'created_at': u'2007-08-14',
+            'title': u'Brzydkie kaczÄtko',
+            'kind': u'Epika',
+            'source_url': u'http://www.polona.pl/dlibra/doccontent2?id=3563&dirids=4',
+            'translator': u'Niewiadomska, Cecylia',
+            'released_to_public_domain_at': u'1925-01-01',
+            'epoch': u'Romantyzm',
+            'genre': u'BaÅÅ',
+            'technical_editor': u'GaÅecki, Dariusz',
+            'license_description': u'Domena publiczna - tÅumacz Cecylia Niewiadomska zm. 1925',
+        }),
+        ('dcparser', 'kochanowski_piesn7.xml', {
+            'publisher': u'Fundacja Nowoczesna Polska',
+            'about': u'http://wiki.wolnepodreczniki.pl/Lektury:Kochanowski/PieÅni/PieÅÅ_VII_(1)',
+            'source_name': u'Kochanowski, Jan (1530-1584), DzieÅa polskie, tom 1, oprac. Julian KrzyÅ¼anowski, wyd. 8, PaÅstwowy Instytut Wydawniczy, Warszawa, 1976',
+            'author': u'Kochanowski, Jan',
+            'url': u'http://wolnelektury.pl/katalog/lektura/piesni-ksiegi-pierwsze-piesn-vii-trudna-rada-w-tej-mierze-pr',
+            'created_at': u'2007-08-31',
+            'title': u'PieÅÅ VII (Trudna rada w tej mierze: przyjdzie siÄ rozjechaÄ...)',
+            'kind': u'Liryka',
+            'source_url': u'http://www.polona.pl/Content/1499',
+            'released_to_public_domain_at': u'1584-01-01',
+            'epoch': u'Renesans',
+            'genre': u'PieÅÅ',
+            'technical_editor': u'GaÅecki, Dariusz',
+            'license_description': u'Domena publiczna - Jan Kochanowski zm. 1584 ',
+        }),
+        ('dcparser', 'mickiewicz_rybka.xml', {
+            'publisher': u'Fundacja Nowoczesna Polska',
+            'about': 'http://wiki.wolnepodreczniki.pl/Lektury:Mickiewicz/Ballady/Rybka',
+            'source_name': u'Mickiewicz, Adam (1798-1855), Poezje, tom 1 (Wiersze mÅodzieÅcze - Ballady i romanse - Wiersze do r. 1824), Krakowska SpÃ³Ådzielnia Wydawnicza, wyd. 2 zwiÄkszone, KrakÃ³w, 1922',
+            'author': u'Mickiewicz, Adam',
+            'url': u'http://wolnelektury.pl/katalog/lektura/ballady-i-romanse-rybka',
+            'created_at': u'2007-09-06',
+            'title': u'Rybka',
+            'kind': u'Liryka',
+            'source_url': u'http://www.polona.pl/Content/2222',
+            'released_to_public_domain_at': u'1855-01-01',
+            'epoch': u'Romantyzm',
+            'genre': u'Ballada',
+            'technical_editor': u'Sutkowska, Olga',
+            'license_description': u'Domena publiczna - Adam Mickiewicz zm. 1855',
+        }),
+        ('dcparser', 'sofokles_antygona.xml', {
+            'publisher': u'Fundacja Nowoczesna Polska',
+            'about': 'http://wiki.wolnepodreczniki.pl/Lektury:Sofokles/Antygona',
+            'source_name': u'Sofokles (496-406 a.C.), Antygona, ZakÅad Narodowy im. OssoliÅskich, wyd. 7, LwÃ³w, 1939',
+            'author': u'Sofokles',
+            'url': u'http://wolnelektury.pl/katalog/lektura/antygona',
+            'created_at': u'2007-08-30',
+            'title': u'Antygona',
+            'kind': u'Dramat',
+            'source_url': u'http://www.polona.pl/Content/3768',
+            'translator': u'Morawski, Kazimierz',
+            'released_to_public_domain_at': u'1925-01-01',
+            'epoch': u'StaroÅ¼ytnoÅÄ',
+            'genre': u'Tragedia',
+            'technical_editor': u'GaÅecki, Dariusz',
+            'license_description': u'Domena publiczna - tÅumacz Kazimierz Morawski zm. 1925',
+        }),
+        ('dcparser', 'biedrzycki_akslop.xml', {
+            'publisher': u'Fundacja Nowoczesna Polska',
+            'about': 'http://wiki.wolnepodreczniki.pl/Lektury:Biedrzycki/Akslop',
+            'source_name': u'MiÅosz Biedrzycki, * ("Gwiazdka"), Fundacja "brulion", KrakÃ³w-Warszawa, 1993',
+            'author': u'Biedrzycki, MiÅosz',
+            'url': u'http://wolnelektury.pl/katalog/lektura/akslop',
+            'created_at': u'2009-06-04',
+            'title': u'Akslop',
+            'kind': u'Liryka',
+            'source_url': u'http://free.art.pl/mlb/gwiazdka.html#t1',
+            'epoch': u'WspÃ³ÅczesnoÅÄ',
+            'genre': u'Wiersz',
+            'technical_editor': u'Sutkowska, Olga',
+            'license': u'http://creativecommons.org/licenses/by-sa/3.0/',
+            'license_description': u'Creative Commons Uznanie Autorstwa - Na Tych Samych Warunkach 3.0.PL'
+        }),
+    )
+    
+    def test_parse(self):
+        for dir_name, file_name, result in self.KNOWN_RESULTS:
+            self.assertEqual(dcparser.parse(test_file_path(dir_name, file_name)).to_dict(), result)
+
+
+class TestParserErrors(unittest.TestCase):
+    def test_error(self):
+        try:
+            html.transform(test_file_path('erroneous', 'asnyk_miedzy_nami.xml'),
+                           test_file_path('erroneous', 'asnyk_miedzy_nami.html'))
+            self.fail()
+        except etree.XMLSyntaxError, e:
+            self.assertEqual(e.position, (25, 13))
+
+
+if __name__ == '__main__':
+    unittest.main()
\ No newline at end of file
diff --git a/librarian/tests/files/dcparser/.DS_Store b/librarian/tests/files/dcparser/.DS_Store
new file mode 100644
index 0000000000000000000000000000000000000000..8817fe608d38202e1a6a534b520570045b510a0f
GIT binary patch
literal 6148
zcmeHK!AiqG5Pe%KRJ`<H#gpt82%fx#QV*W}fS9ILOJX9eqU|Yvu5V_SVyHq+Qpya>
zzU^e^?d;o-?E-M)_t`Zt1Tdfr_D<ORV)9&k$9gexOmxbz#0qm%NHN_RZGnAMK=$qu
z8TV|)o%^|eOKh-aw7`N-QeuXju?%nQ*SNwbUQphZbv`X?+3(?3%XGOTz6p{)Be(G7
z%9oO*;JZ?i=d~l#xz3v7S*xw_!F;JLC4<bc;u>x`a-FgAMXY5`Ch2d;v}A=-vSuB5
zMx3?ABfa2Sqy|}8MTORQVzlbaw2$wG)np2o0*9*r&up>5X+UdD0aL&f*eW332TvDF
zA~pf_)4@is0K`7SYV6BhLUMe>Bw`bgPiQWr5<{wsR}2@@8TWBq60r#w(&2Pw^2C{4
zyrDRqopG<j;gW#XngXUkTY;nSb13Kk?cewRc9Q)v1x$g1Qo!{m_meS~6wlV3#mQOg
s=?`=<8P^2drm&+&F~`bLd_h-Z+)Ia;L~H^wLbE>tDuXqqz`rW+4Xmw^kpKVy

literal 0
HcmV?d00001

diff --git a/librarian/tests/files/dcparser/andersen_brzydkie_kaczatko.xml b/librarian/tests/files/dcparser/andersen_brzydkie_kaczatko.xml
new file mode 100644
index 0000000..d653a9b
--- /dev/null
+++ b/librarian/tests/files/dcparser/andersen_brzydkie_kaczatko.xml
@@ -0,0 +1,24 @@
+<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/">
+    <rdf:Description rdf:about="http://wiki.wolnepodreczniki.pl/Lektury:Andersen/Brzydkie_kaczÄtko">
+        <dc:creator xml:lang="pl">Andersen, Hans Christian</dc:creator>
+        <dc:title xml:lang="pl">Brzydkie kaczÄtko</dc:title>
+        <dc:contributor.translator xml:lang="pl">Niewiadomska, Cecylia</dc:contributor.translator>
+        <dc:contributor.technical_editor xml:lang="pl">GaÅecki, Dariusz</dc:contributor.technical_editor>
+        <dc:publisher xml:lang="pl">Fundacja Nowoczesna Polska</dc:publisher>
+        <dc:subject.period xml:lang="pl">Romantyzm</dc:subject.period>
+        <dc:subject.type xml:lang="pl">Epika</dc:subject.type>
+        <dc:subject.genre xml:lang="pl">BaÅÅ</dc:subject.genre>
+        <dc:description xml:lang="pl">Publikacja zrealizowana w ramach projektu Wolne Lektury (http://wolnelektury.pl). Reprodukcja cyfrowa wykonana przez BibliotekÄ NarodowÄ z egzemplarza pochodzÄcego ze zbiorÃ³w BN.</dc:description>
+        <dc:identifier.url xml:lang="pl">http://wolnelektury.pl/katalog/lektura/brzydkie-kaczatko</dc:identifier.url>
+        <dc:source.URL xml:lang="pl">http://www.polona.pl/dlibra/doccontent2?id=3563&amp;dirids=4</dc:source.URL>
+        <dc:source xml:lang="pl">Andersen, Hans Christian (1805-1875), BaÅnie, Gebethner i Wolff, wyd. 7, KrakÃ³w, 1925</dc:source>
+        <dc:rights xml:lang="pl">Domena publiczna - tÅumacz Cecylia Niewiadomska zm. 1925</dc:rights>
+        <dc:date.pd xml:lang="pl">1925</dc:date.pd>
+        <dc:format xml:lang="pl">xml</dc:format>
+        <dc:type xml:lang="pl">text</dc:type>
+        <dc:type xml:lang="en">text</dc:type>
+        <dc:date xml:lang="pl">2007-08-14</dc:date>
+        <dc:audience xml:lang="pl">SP1</dc:audience>
+        <dc:language xml:lang="pl">pol</dc:language>
+    </rdf:Description>
+</rdf:RDF>
\ No newline at end of file
diff --git a/librarian/tests/files/dcparser/biedrzycki_akslop.xml b/librarian/tests/files/dcparser/biedrzycki_akslop.xml
new file mode 100644
index 0000000..da0cd9f
--- /dev/null
+++ b/librarian/tests/files/dcparser/biedrzycki_akslop.xml
@@ -0,0 +1,25 @@
+<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
+xmlns:dc="http://purl.org/dc/elements/1.1/">
+    <rdf:Description rdf:about="http://wiki.wolnepodreczniki.pl/Lektury:Biedrzycki/Akslop">
+        <dc:creator xml:lang="pl">Biedrzycki, MiÅosz</dc:creator>
+        <dc:title xml:lang="pl">Akslop</dc:title>
+        <dc:contributor.editor xml:lang="pl">SekuÅa, Aleksandra</dc:contributor.editor>
+        <dc:contributor.technical_editor xml:lang="pl">Sutkowska, Olga</dc:contributor.technical_editor>
+        <dc:publisher xml:lang="pl">Fundacja Nowoczesna Polska</dc:publisher>
+        <dc:subject.period xml:lang="pl">WspÃ³ÅczesnoÅÄ</dc:subject.period>
+        <dc:subject.type xml:lang="pl">Liryka</dc:subject.type>
+        <dc:subject.genre xml:lang="pl">Wiersz</dc:subject.genre>
+        <dc:description xml:lang="pl">Publikacja zrealizowana w ramach projektu Wolne Lektury (http://wolnelektury.pl).</dc:description>
+        <dc:identifier.url xml:lang="pl">http://wolnelektury.pl/katalog/lektura/akslop</dc:identifier.url>
+        <dc:source.URL xml:lang="pl">http://free.art.pl/mlb/gwiazdka.html#t1</dc:source.URL>
+        <dc:source xml:lang="pl">MiÅosz Biedrzycki, * ("Gwiazdka"), Fundacja "brulion", KrakÃ³w-Warszawa, 1993</dc:source>
+        <dc:rights xml:lang="pl">Creative Commons Uznanie Autorstwa - Na Tych Samych Warunkach 3.0.PL</dc:rights>
+        <dc:rights.license>http://creativecommons.org/licenses/by-sa/3.0/</dc:rights.license>
+        <dc:format xml:lang="pl">xml</dc:format>
+        <dc:type xml:lang="pl">text</dc:type>
+        <dc:type xml:lang="en">text</dc:type>
+        <dc:date xml:lang="pl">2009-06-04</dc:date>
+        <dc:audience xml:lang="pl">L</dc:audience>
+        <dc:language xml:lang="pl">pol</dc:language>
+    </rdf:Description>
+</rdf:RDF>
\ No newline at end of file
diff --git a/librarian/tests/files/dcparser/kochanowski_piesn7.xml b/librarian/tests/files/dcparser/kochanowski_piesn7.xml
new file mode 100644
index 0000000..96be1ae
--- /dev/null
+++ b/librarian/tests/files/dcparser/kochanowski_piesn7.xml
@@ -0,0 +1,27 @@
+<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/">
+    <rdf:Description rdf:about="http://wiki.wolnepodreczniki.pl/Lektury:Kochanowski/PieÅni/PieÅÅ_VII_(1)">
+        <dc:creator xml:lang="pl">Kochanowski, Jan</dc:creator>
+        <dc:title xml:lang="pl">PieÅÅ VII (Trudna rada w tej mierze: przyjdzie siÄ rozjechaÄ...)</dc:title>
+        <dc:relation.isPartOf xml:lang="pl">http://www.wolnelektury.pl/lektura/piesni-ksiegi-pierwsze</dc:relation.isPartOf>
+        <dc:contributor.editor xml:lang="pl">SekuÅa, Aleksandra</dc:contributor.editor>
+        <dc:contributor.editor xml:lang="pl">KrzyÅ¼anowski, Julian</dc:contributor.editor>
+        <dc:contributor.editor xml:lang="pl">Otwinowska, Barbara</dc:contributor.editor>
+        <dc:contributor.technical_editor xml:lang="pl">GaÅecki, Dariusz</dc:contributor.technical_editor>
+        <dc:publisher xml:lang="pl">Fundacja Nowoczesna Polska</dc:publisher>
+        <dc:subject.period xml:lang="pl">Renesans</dc:subject.period>
+        <dc:subject.type xml:lang="pl">Liryka</dc:subject.type>
+        <dc:subject.genre xml:lang="pl">PieÅÅ</dc:subject.genre>
+        <dc:description xml:lang="pl">Publikacja zrealizowana w ramach projektu Wolne Lektury (http://wolnelektury.pl). Reprodukcja cyfrowa wykonana przez BibliotekÄ NarodowÄ z egzemplarza pochodzÄcego ze zbiorÃ³w BN.</dc:description>
+        <dc:identifier.url xml:lang="pl">http://wolnelektury.pl/katalog/lektura/piesni-ksiegi-pierwsze-piesn-vii-trudna-rada-w-tej-mierze-pr</dc:identifier.url>
+        <dc:source.URL xml:lang="pl">http://www.polona.pl/Content/1499</dc:source.URL>
+        <dc:source xml:lang="pl">Kochanowski, Jan (1530-1584), DzieÅa polskie, tom 1, oprac. Julian KrzyÅ¼anowski, wyd. 8, PaÅstwowy Instytut Wydawniczy, Warszawa, 1976</dc:source>
+        <dc:rights xml:lang="pl">Domena publiczna - Jan Kochanowski zm. 1584 </dc:rights>
+        <dc:date.pd xml:lang="pl">1584</dc:date.pd>
+        <dc:format xml:lang="pl">xml</dc:format>
+        <dc:type xml:lang="pl">text</dc:type>
+        <dc:type xml:lang="en">text</dc:type>
+        <dc:date xml:lang="pl">2007-08-31</dc:date>
+        <dc:audience xml:lang="pl">L</dc:audience>
+        <dc:language xml:lang="pl">pol</dc:language>
+    </rdf:Description>
+</rdf:RDF>
\ No newline at end of file
diff --git a/librarian/tests/files/dcparser/mickiewicz_rybka.xml b/librarian/tests/files/dcparser/mickiewicz_rybka.xml
new file mode 100644
index 0000000..0796a5b
--- /dev/null
+++ b/librarian/tests/files/dcparser/mickiewicz_rybka.xml
@@ -0,0 +1,28 @@
+<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/">
+    <rdf:Description rdf:about="http://wiki.wolnepodreczniki.pl/Lektury:Mickiewicz/Ballady/Rybka">
+        <dc:creator xml:lang="pl">Mickiewicz, Adam</dc:creator>
+        <dc:title xml:lang="pl">Rybka</dc:title>
+        <dc:relation.isPartOf xml:lang="pl">http://www.wolnelektury.pl/lektura/ballady-i-romanse</dc:relation.isPartOf>
+        <dc:contributor.editor xml:lang="pl">SekuÅa, Aleksandra</dc:contributor.editor>
+        <dc:contributor.editor xml:lang="pl">Kallenbach, JÃ³zef</dc:contributor.editor>
+        <dc:contributor.technical_editor xml:lang="pl">Sutkowska, Olga</dc:contributor.technical_editor>
+        <dc:publisher xml:lang="pl">Fundacja Nowoczesna Polska</dc:publisher>
+        <dc:subject.period xml:lang="pl">Romantyzm</dc:subject.period>
+        <dc:subject.type xml:lang="pl">Liryka</dc:subject.type>
+        <dc:subject.genre xml:lang="pl">Ballada</dc:subject.genre>
+        <dc:description xml:lang="pl">Publikacja zrealizowana w ramach projektu Wolne Lektury (http://wolnelektury.pl). Reprodukcja cyfrowa wykonana przez BibliotekÄ NarodowÄ z egzemplarza pochodzÄcego ze zbiorÃ³w BN.</dc:description>
+        <dc:identifier.url xml:lang="pl">http://wolnelektury.pl/katalog/lektura/ballady-i-romanse-rybka</dc:identifier.url>
+        <dc:source.URL xml:lang="pl">http://www.polona.pl/Content/2222</dc:source.URL>
+        <dc:source xml:lang="pl">Mickiewicz, Adam (1798-1855), Poezje, tom 1 (Wiersze mÅodzieÅcze - Ballady i romanse - Wiersze do r. 1824), Krakowska SpÃ³Ådzielnia Wydawnicza, wyd. 2 zwiÄkszone, KrakÃ³w, 1922</dc:source>
+        <dc:rights xml:lang="pl">Domena publiczna - Adam Mickiewicz zm. 1855</dc:rights>
+        <dc:date.pd xml:lang="pl">1855</dc:date.pd>
+        <dc:format xml:lang="pl">xml</dc:format>
+        <dc:type xml:lang="pl">text</dc:type>
+        <dc:type xml:lang="en">text</dc:type>
+        <dc:date xml:lang="pl">2007-09-06</dc:date>
+        <dc:audience xml:lang="pl">SP2</dc:audience>
+        <dc:audience xml:lang="pl">G</dc:audience>
+        <dc:audience xml:lang="pl">L</dc:audience>
+        <dc:language xml:lang="pl">pol</dc:language>
+    </rdf:Description>
+</rdf:RDF>
\ No newline at end of file
diff --git a/librarian/tests/files/dcparser/sofokles_antygona.xml b/librarian/tests/files/dcparser/sofokles_antygona.xml
new file mode 100644
index 0000000..4acb2d4
--- /dev/null
+++ b/librarian/tests/files/dcparser/sofokles_antygona.xml
@@ -0,0 +1,25 @@
+<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/">
+    <rdf:Description rdf:about="http://wiki.wolnepodreczniki.pl/Lektury:Sofokles/Antygona">
+        <dc:creator xml:lang="pl">Sofokles</dc:creator>
+        <dc:title xml:lang="pl">Antygona</dc:title>
+        <dc:contributor.editor xml:lang="pl">SekuÅa, Aleksandra</dc:contributor.editor>
+        <dc:contributor.translator xml:lang="pl">Morawski, Kazimierz</dc:contributor.translator>
+        <dc:contributor.technical_editor xml:lang="pl">GaÅecki, Dariusz</dc:contributor.technical_editor>
+        <dc:publisher xml:lang="pl">Fundacja Nowoczesna Polska</dc:publisher>
+        <dc:subject.period xml:lang="pl">StaroÅ¼ytnoÅÄ</dc:subject.period>
+        <dc:subject.type xml:lang="pl">Dramat</dc:subject.type>
+        <dc:subject.genre xml:lang="pl">Tragedia</dc:subject.genre>
+        <dc:description xml:lang="pl">Publikacja zrealizowana w ramach projektu Wolne Lektury (http://wolnelektury.pl). Reprodukcja cyfrowa wykonana przez BibliotekÄ NarodowÄ z egzemplarza pochodzÄcego ze zbiorÃ³w BN.</dc:description>
+        <dc:identifier.url xml:lang="pl">http://wolnelektury.pl/katalog/lektura/antygona</dc:identifier.url>
+        <dc:source.URL xml:lang="pl">http://www.polona.pl/Content/3768</dc:source.URL>
+        <dc:source xml:lang="pl">Sofokles (496-406 a.C.), Antygona, ZakÅad Narodowy im. OssoliÅskich, wyd. 7, LwÃ³w, 1939</dc:source>
+        <dc:rights xml:lang="pl">Domena publiczna - tÅumacz Kazimierz Morawski zm. 1925</dc:rights>
+        <dc:date.pd xml:lang="pl">1925</dc:date.pd>
+        <dc:format xml:lang="pl">xml</dc:format>
+        <dc:type xml:lang="pl">text</dc:type>
+        <dc:type xml:lang="en">text</dc:type>
+        <dc:date xml:lang="pl">2007-08-30</dc:date>
+        <dc:audience xml:lang="pl">G</dc:audience>
+        <dc:language xml:lang="pl">pol</dc:language>
+    </rdf:Description>
+</rdf:RDF>
\ No newline at end of file
diff --git a/librarian/tests/files/erroneous/asnyk_miedzy_nami.html b/librarian/tests/files/erroneous/asnyk_miedzy_nami.html
new file mode 100644
index 0000000..1d7e17f
--- /dev/null
+++ b/librarian/tests/files/erroneous/asnyk_miedzy_nami.html
@@ -0,0 +1,46 @@
+<div xmlns:wl="http://wolnelektury.pl/functions" id="book-text">
+  <div id="toc">
+    <h2>Spis treÅci</h2>
+    <ol/>
+  </div>
+  <h1>
+    <span class="author">Adam Asnyk</span>
+    <span class="title">MiÄdzy nami nic nie byÅo</span>
+  </h1>
+  <div class="stanza">
+    <p class="verse"><a name="f1" class="target"> </a><a href="#f1" class="anchor">1</a>MiÄdzy nami nic nie byÅo!</p>
+    <p class="verse">
+    Å»adnych zwierzeÅ, wyznaÅ Å¼adnych!</p>
+    <p class="verse">
+    Nic nas z sobÄ nie ÅÄczyÅo â</p>
+    <p class="verse">
+    PrÃ³cz wiosennych marzeÅ zdradnych;</p>
+  </div>
+  <div class="stanza">
+    <p class="verse"><a name="f5" class="target"> </a><a href="#f5" class="anchor">5</a>PrÃ³cz tych woni, barw i blaskÃ³w,</p>
+    <p class="verse">
+    UnoszÄcych siÄ w przestrzeni;</p>
+    <p class="verse">
+    PrÃ³cz szumiÄcych Åpiewem laskÃ³w</p>
+    <p class="verse">
+    I tej ÅwieÅ¼ej ÅÄk zieleni;</p>
+  </div>
+  <div class="stanza">
+    <p class="verse">PrÃ³cz tych kaskad i potokÃ³w,</p>
+    <p class="verse"><a name="f10" class="target"> </a><a href="#f10" class="anchor">10</a>
+    ZraszajÄcych kaÅ¼dy parÃ³w,</p>
+    <p class="verse">
+    PrÃ³cz girlandy tÄcz, obÅokÃ³w,</p>
+    <p class="verse">
+    PrÃ³cz natury sÅodkich czarÃ³w;</p>
+  </div>
+  <div class="stanza">
+    <p class="verse">PrÃ³cz tych wspÃ³lnych, jasnych zdrojÃ³w,</p>
+    <p class="verse">
+    Z ktÃ³rych serce zachwyt piÅo;</p>
+    <p class="verse"><a name="f15" class="target"> </a><a href="#f15" class="anchor">15</a>
+    PrÃ³cz pierwiosnkÃ³w i powojÃ³w,â</p>
+    <p class="verse">
+    MiÄdzy nami nic nie byÅo!</p>
+  </div>
+</div>
diff --git a/librarian/tests/files/erroneous/asnyk_miedzy_nami.xml b/librarian/tests/files/erroneous/asnyk_miedzy_nami.xml
new file mode 100644
index 0000000..aa5ef17
--- /dev/null
+++ b/librarian/tests/files/erroneous/asnyk_miedzy_nami.xml
@@ -0,0 +1,25 @@
+<?xml version='1.0' encoding='utf-8'?>
+<utwor><liryka_lp>
+    <autor_utworu>Adam Asnyk</autor_utworu>
+    <nazwa_utworu>MiÄdzy nami nic nie byÅo</nazwa_utworu>
+
+    <strofa>MiÄdzy nami nic nie byÅo!/
+    Å»adnych zwierzeÅ, wyznaÅ Å¼adnych!/
+    Nic nas z sobÄ nie ÅÄczyÅo ---/
+    PrÃ³cz wiosennych marzeÅ zdradnych;</strofa>
+
+    <strofa>PrÃ³cz tych woni, barw i blaskÃ³w,/
+    UnoszÄcych siÄ w przestrzeni;/
+    PrÃ³cz szumiÄcych Åpiewem laskÃ³w/
+    I tej ÅwieÅ¼ej ÅÄk zieleni;
+
+    <strofa>PrÃ³cz tych kaskad i potokÃ³w,/
+    ZraszajÄcych kaÅ¼dy parÃ³w,/
+    PrÃ³cz girlandy tÄcz, obÅokÃ³w,/
+    PrÃ³cz natury sÅodkich czarÃ³w;</strofa>
+
+    <strofa>PrÃ³cz tych wspÃ³lnych, jasnych zdrojÃ³w,/
+    Z ktÃ³rych serce zachwyt piÅo;/
+    PrÃ³cz pierwiosnkÃ³w i powojÃ³w,---/
+    MiÄdzy nami nic nie byÅo!</strofa>
+</liryka_lp></utwor>
diff --git a/librarian/text.py b/librarian/text.py
new file mode 100644
index 0000000..db0d2b2
--- /dev/null
+++ b/librarian/text.py
@@ -0,0 +1,89 @@
+# -*- coding: utf-8 -*-
+import os
+import cStringIO
+import re
+import codecs
+
+from lxml import etree
+
+from librarian import dcparser
+
+
+ENTITY_SUBSTITUTIONS = [
+    (u'---', u'â'),
+    (u'--', u'â'),
+    (u'...', u'â¦'),
+    (u',,', u'â'),
+    (u'"', u'â'),
+]
+
+
+MAX_LINE_LENGTH = 80
+
+
+def strip(context, text):
+    """Remove unneeded whitespace from beginning and end"""
+    if isinstance(text, list):
+        text = ''.join(text)
+    return re.sub(r'\s+', ' ', text).strip()
+
+
+def substitute_entities(context, text):
+    """XPath extension function converting all entites in passed text."""
+    if isinstance(text, list):
+        text = ''.join(text)
+    for entity, substitutution in ENTITY_SUBSTITUTIONS:
+        text = text.replace(entity, substitutution)
+    return text
+
+
+def wrap_words(context, text):
+    """XPath extension function automatically wrapping words in passed text"""
+    if isinstance(text, list):
+        text = ''.join(text)
+    words = re.split(r'\s', text)
+    
+    line_length = 0
+    lines = [[]]
+    for word in words:
+        line_length += len(word) + 1
+        if line_length > MAX_LINE_LENGTH:
+            # Max line length was exceeded. We create new line
+            lines.append([])
+            line_length = len(word)
+        lines[-1].append(word)
+    return '\n'.join(' '.join(line) for line in lines)
+
+
+# Register substitute_entities function with lxml
+ns = etree.FunctionNamespace('http://wolnelektury.pl/functions')
+ns['strip'] = strip
+ns['substitute_entities'] = substitute_entities
+ns['wrap_words'] = wrap_words
+
+
+def transform(input_filename, output_filename):
+    """Transforms file input_filename in XML to output_filename in TXT."""
+    # Parse XSLT
+    style_filename = os.path.join(os.path.dirname(__file__), 'book2txt.xslt')
+    style = etree.parse(style_filename)
+
+    doc_file = cStringIO.StringIO()
+    expr = re.compile(r'/\s', re.MULTILINE | re.UNICODE);
+    
+    f = open(input_filename, 'r')
+    for line in f:
+        line = line.decode('utf-8')
+        line = expr.sub(u'<br/>\n', line)
+        doc_file.write(line.encode('utf-8'))
+    f.close()
+
+    doc_file.seek(0)
+
+    parser = etree.XMLParser(remove_blank_text=True)
+    doc = etree.parse(doc_file, parser)
+    
+    result = doc.xslt(style)
+    output_file = codecs.open(output_filename, 'wb', encoding='utf-8')
+    output_file.write(unicode(result) % dcparser.parse(input_filename).url)
+
diff --git a/librarian/text.pyc b/librarian/text.pyc
new file mode 100644
index 0000000000000000000000000000000000000000..6c6eb91802d9dea061615b0f83adc4b5dc39c1c6
GIT binary patch
literal 2993
zcmb_eUvC>l5T8B&N$kW;nxtvcLgj*lEY#RlUnmetX%irjy3xg<A!=kfzD>H#<<7a?
zYaHZAmC83LukgqlPdxH%_y~Lf_|2S?lp-V~>OXrkyK_6UJHOxT{`yCyZ0paz>eBEt
zj^|zc?JsBo{1ojIZJo)Aw$y3AM_b;hoTIIr$R6$IDJ;-dffT==qx~X<BeXRF{SpPU
z6kMiYj)HmGgViVn7ig<Q!32E|KV=FgMHnMpATv(EMS20B71CwW6$++kQDY3!G%W@*
zVtaw3T(4b0#O6<Ynl%N{70_sxXq~B}yr6EclUSXkIVcMY3-bK^`46cl`cQo-&w9N+
z)PI)Y8#jjPPbp9T&QSZ&tU>GY1o`3rKAx6)9nnCMQ}n{4cpB?hWIXP|l1>ywid6qS
zayeSszDAEdI>9f;<0el780Ppz7#_Y)kI=hbV=wkoG@EN3_oS-(PDj?nQFS+sx{ifz
z96i&CGtpkP6NXhCIpeggnyA|ASgV7o!%KApMpWYsa%D8en#j6N)YXpH5E|=5cp96?
z&7fzw*;;9R+g{(ew+>;WweqmJ?nW?>=w8_A>KeZ$9q`W{<aH5>7?CKB-35p?-LVKM
z#TVh$&_mMLk0CWSkQ>|hF5S^dV=alF>V0?IIEuqahY-``xZVpJq1oYo(n(AwYRGze
z$8P%7$#q*?8g1ven?X(9q?%SEG_GcqWQzmi9guAO2H`(s3#meCf-HxUFW?&~+auaT
zO7qm;=EN;+Z_r7B^9K+P3Y_jBPnSR7<f5-gPxBPNO=^%QGr}*!K%JSwijjfApg{95
z$YxN7U(=(Y$OsBX822z(!i)H=*BIP(3C+I(qm#P$pyNyzusE(BC7oW6L2?u)!Rzqw
z1!mklwgxR32E0(qvQ+MJ%i~NV%l~)K^smx@XnTec8^B(`kLbQphebqwieJ!ysG4!q
z=L86<9Zy%kImBP2-yAY*2{SM5=}7l`$(@@}IAW45^LYV2gI6MvAQCN=!}dbskZ;fd
zSen4|!DpN8)s^OQdv&?_Me9qXkqEn}qoBs3&pGhfnY=F>>&BplCem$8vge-22<uiB
z$~JFqp+aR&Y+HO^hil6<F+={8S5zh7zo=$Z#jB`EbxGMOMxQv>`>62`mYr4<>oa@&
zc{D;B)|mN1o7>1GXajrzl|uml&kN$E?4hJ#(Wc0>02Y94lnFCRFNo>lN@P&-VFO`I
z+HtzaMXx}v!f*n=SS?b2nFd8L>k~QwBQOW5zW8Ak9wwMA=x1y6fLW7bc5!G1=jt#*
z9R-7?*uAiCn!qR?;vi?3Snd)A)ye2-*r>#a7L%4}fFNh3Dq|sKa+k><Mt~iM7)~%m
z<EfJ|8jP`TH%EgqPwnPq`9gAYg=X1XPzGli8}=@mR?>;=Zk!z0>aGbjighn_Z5E@>
z0jt%`2dh;VSL4*ZKGNE3)olfn?8Nc@Er;6Px1qC)+s0!nTuUsoEOomJw^Ih{;!e`I
zQx;;oi_jB&5I@uHov;(_x20w?7ms!v16oJjI6$Fj)~-Smg2WkkdpLnI)-W6blW?%|
zPFrGcw|(?yWRO!AIR=K-U4rRW9*X6u;!m<A&(n<$dRVyFKG;}otuW(cWTUxq|KZZI
z5GMxfgnxlXcv@(RlO-cwf)h^$CH9QX-7vP<;bt{X5{?9Wx+a$anX#3m**I^Xyv-AL
zt+-Aj!<x^POMInCSYsl{k@oj=NvU`(QQ67ojzfKxRSDH{muy53cV$Ro;X);u+x5Bb
zNHp2KMV!M{x)N<u#L6&w#orsOCsNB!vH2m~NSUYHbv5CQtGB!fDJK(ZN?lQ9ui{Oq
zDfG=LDd=)NdgY3hbuzNfu3azB4PUuzog1FtxUxRp{<CXWjkm_X#?8CjFoOJBXk-h+
z{y~_*j~8)vTaXO;Qmy&Ea9-Mk2%irxQB45Z_HeBcxJTB%3)}O373u%pS1glj@gNS;
iP~YKQk-Z&P^7SUY$$U;_-%`GqE0s#q6RNDrxxWCiK#NEK

literal 0
HcmV?d00001

diff --git a/scripts/book2html b/scripts/book2html
new file mode 100755
index 0000000..a0229bb
--- /dev/null
+++ b/scripts/book2html
@@ -0,0 +1,31 @@
+#!/usr/bin/env python
+import os
+import optparse
+
+from librarian import html
+
+
+if __name__ == '__main__':
+    # Parse commandline arguments
+    usage = """Usage: %prog [options] SOURCE [SOURCE...]
+    Convert SOURCE files to HTML format."""
+
+    parser = optparse.OptionParser(usage=usage)
+
+    parser.add_option('-v', '--verbose', action='store_true', dest='verbose', default=False,
+        help='print status messages to stdout')
+
+    options, input_filenames = parser.parse_args()
+
+    if len(input_filenames) < 1:
+        parser.print_help()
+        exit(1)
+
+    # Do some real work
+    for input_filename in input_filenames:
+        if options.verbose:
+            print input_filename
+        
+        output_filename = os.path.splitext(input_filename)[0] + '.html'
+        html.transform(input_filename, output_filename)
+
diff --git a/scripts/book2txt b/scripts/book2txt
new file mode 100755
index 0000000..1ca4623
--- /dev/null
+++ b/scripts/book2txt
@@ -0,0 +1,31 @@
+#!/usr/bin/env python
+import os
+import optparse
+
+from librarian import text
+
+
+if __name__ == '__main__':
+    # Parse commandline arguments
+    usage = """Usage: %prog [options] SOURCE [SOURCE...]
+    Convert SOURCE files to TXT format."""
+
+    parser = optparse.OptionParser(usage=usage)
+
+    parser.add_option('-v', '--verbose', action='store_true', dest='verbose', default=False,
+        help='print status messages to stdout')
+
+    options, input_filenames = parser.parse_args()
+
+    if len(input_filenames) < 1:
+        parser.print_help()
+        exit(1)
+
+    # Do some real work
+    for input_filename in input_filenames:
+        if options.verbose:
+            print input_filename
+        
+        output_filename = os.path.splitext(input_filename)[0] + '.txt'
+        text.transform(input_filename, output_filename)
+
diff --git a/scripts/bookfragments b/scripts/bookfragments
new file mode 100755
index 0000000..f29e11e
--- /dev/null
+++ b/scripts/bookfragments
@@ -0,0 +1,50 @@
+#!/usr/bin/env python
+import os
+import optparse
+
+from librarian import html
+
+
+if __name__ == '__main__':
+    # Parse commandline arguments
+    usage = """Usage: %prog [options] SOURCE [SOURCE...]
+    Extract theme fragments from SOURCE."""
+    
+    parser = optparse.OptionParser(usage=usage)
+    
+    parser.add_option('-v', '--verbose', action='store_true', dest='verbose', default=False,
+        help='print status messages to stdout')
+    
+    options, input_filenames = parser.parse_args()
+    
+    if len(input_filenames) < 1:
+        parser.print_help()
+        exit(1)
+    
+    # Do some real work
+    for input_filename in input_filenames:
+        if options.verbose:
+            print input_filename
+    
+        output_filename = os.path.splitext(input_filename)[0] + '.fragments.html'
+    
+        closed_fragments, open_fragments = html.extract_fragments(input_filename)
+
+        for fragment_id in open_fragments:
+            print '%s:warning:unclosed fragment #%s' % (input_filename, fragment_id)
+
+        output_file = open(output_filename, 'w')
+        output_file.write("""
+            <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">
+            <html><head>
+                <title>bookfragments output</title>
+                <meta http-equiv="content-type" content="text/html;charset=utf-8"/>
+                <link rel="stylesheet" href="master.css" type="text/css" media="screen" charset="utf-8" />
+            </head>
+            <body>""")
+        for fragment in closed_fragments.values():
+            fragment_html = u'<div class="fragment"><h3>[#%s] %s</h3>%s</div>' % (fragment.id, fragment.themes, fragment)
+            output_file.write(fragment_html.encode('utf-8'))
+        output_file.write('</body></html>')
+        output_file.close()
+
diff --git a/scripts/genslugs b/scripts/genslugs
new file mode 100755
index 0000000..3391d8e
--- /dev/null
+++ b/scripts/genslugs
@@ -0,0 +1,64 @@
+#!/usr/bin/env python
+# -*- coding: utf-8 -*-
+import os
+import optparse
+
+from lxml import etree
+from librarian import html
+from slughifi import slughifi
+
+
+BOOK_URL = 'http://wolnelektury.pl/katalog/lektura/'
+
+
+if __name__ == '__main__':
+    # Parse commandline arguments
+    usage = """Usage: %prog [options] SOURCE [SOURCE...]
+    Generate slugs for SOURCE."""
+
+    parser = optparse.OptionParser(usage=usage)
+
+    parser.add_option('-v', '--verbose', action='store_true', dest='verbose', default=False,
+        help='print status messages to stdout')
+    parser.add_option('-f', '--force', action='store_true', dest='force', default=False,
+        help='overwrite current identifiers')
+    
+    options, input_filenames = parser.parse_args()
+
+    if len(input_filenames) < 1:
+        parser.print_help()
+        exit(1)
+
+    # Do some real work
+    for input_filename in input_filenames:
+        if options.verbose:
+            print input_filename
+        
+        doc = etree.parse(input_filename)
+        try:
+            title = doc.find('//{http://purl.org/dc/elements/1.1/}title').text
+        except AttributeError:
+            print '%s:error:Book title not found. Skipping.' % input_filename
+            continue
+        
+        parent = ''
+        try:
+            parent_url = doc.find('//{http://purl.org/dc/elements/1.1/}relation.isPartOf').text
+            parent = parent_url.rsplit('/', 1)[1] + ' '
+        except AttributeError:
+            pass
+        except IndexError:
+            print '%s:error:Invalid parent URL "%s". Skipping.' % (input_filename, parent_url)
+            
+        book_url = doc.find('//{http://purl.org/dc/elements/1.1/}identifier.url')
+        if book_url is None:
+            book_description = doc.find('//{http://www.w3.org/1999/02/22-rdf-syntax-ns#}Description')
+            book_url = etree.SubElement(book_description, '{http://purl.org/dc/elements/1.1/}identifier.url')
+        if not options.force and book_url.text.startswith('http://'):
+            print '%s:Notice:Book already has identifier URL "%s". Skipping.' % (input_filename, book_url.text)
+            continue
+        
+        book_url.text = BOOK_URL + slughifi(parent + title)[:60]
+
+        doc.write(input_filename, xml_declaration=True, pretty_print=True, encoding='utf-8')
+
diff --git a/scripts/master.css b/scripts/master.css
new file mode 100644
index 0000000..98e142b
--- /dev/null
+++ b/scripts/master.css
@@ -0,0 +1,207 @@
+body {
+    font-size: 16px;
+    font: Georgia, "Times New Roman", serif;
+    line-height: 1.5em;
+    margin: 3em;
+    max-width: 36em;
+}
+
+a {
+    color: blue;
+    text-decoration: none;
+}
+
+/* =================================================== */
+/* = Common elements: headings, paragraphs and lines = */
+/* =================================================== */
+h1 {
+    font-size: 3em;
+    margin: 1.5em 0;
+    text-align: center;
+    line-height: 1.5em;
+    font-weight: bold;
+}
+
+h2 {
+    font-size: 2em;
+    margin: 1.5em 0 0;
+    font-weight: bold;
+    line-height: 1.5em;
+}
+
+h3 {
+    font-size: 1.5em;
+    margin: 1.5em 0 0;
+    font-weight: normal;
+    line-height: 1.5em;
+}
+
+h4 {
+    font-size: 1em;
+    margin: 1.5em 0 0;
+    line-height: 1.5em;
+}
+
+p {
+    margin: 0;
+}
+
+/* ======================== */
+/* = Footnotes and themes = */
+/* ======================== */
+.theme-begin {
+    border-left: 0.1em solid #DDDDDD;
+    color: #777;
+    padding: 0 0.5em;
+    width: 7.5em;
+    font-style: normal;
+    font-weight: normal;
+    font-size: 16px;
+    position: absolute;
+    left: 40em;
+    line-height: 1.5em;
+    text-align: left;
+}
+
+.annotation {
+    font-style: normal;
+    font-weight: normal;
+    font-size: 12px;
+}
+
+#footnotes .annotation {
+    display: block;
+    float: left;
+    width: 2.5em;
+    clear: both;
+}
+
+#footnotes div {
+    margin: 1.5em 0 0 0;
+}
+
+#footnotes p {
+    margin-left: 2.5em;
+}
+
+
+/* ============= */
+/* = Numbering = */
+/* ============= */
+.anchor {
+    float: left;
+    margin: -0.2em -0.5em -0.2em -3.5em;
+    color: #777;
+    font-size: 12px;
+    width: 2em;
+    text-align: center;
+    padding: 0.2em 0.5em;
+}
+
+.anchor:hover, .anchor:active {
+    color: #FFF;
+    background-color: #CCC;
+}
+
+
+/* =================== */
+/* = Custom elements = */
+/* =================== */
+span.author {
+    font-size: 0.75em;
+    display: block;
+    line-height: 1.5em;
+    margin-bottom: 0.25em;
+}
+
+span.collection {
+    font-size: 0.75em;
+    display: block;
+    line-height: 1.5em;
+    margin-bottom: -0.25em;
+}
+
+span.subtitle {
+    font-size: 0.75em;
+    display: block;
+    line-height: 1.5em;
+    margin-top: -0.25em;
+}
+
+div.didaskalia {
+    font-style: italic;
+    margin: 0.5em 0 0;
+}
+
+div.kwestia {
+    margin: 0.5em 0 0;
+}
+
+div.stanza {
+    margin: 1.5em 0 0;
+}
+
+div.kwestia div.stanza {
+    margin: 0;
+}
+
+p.paragraph {
+    text-align: justify;
+    margin: 1.5em 0 0;
+}
+
+p.motto {
+    text-align: justify;
+    font-style: italic;
+    margin: 1.5em 0 0;
+}
+
+p.motto_podpis {
+    font-size: 0.875em;
+}
+
+div.fragment {
+    border-bottom: 0.1em solid #999;
+    padding-bottom: 1.5em;
+}
+
+div.note p, div.dedication p, div.note p.paragraph, div.dedication p.paragraph {
+    text-align: right;
+    font-style: italic;
+}
+
+hr.spacer {
+    height: 3em;
+    visibility: hidden;
+}
+
+hr.spacer-line {
+    margin: 1.5em 0;
+    border: none;
+    border-bottom: 0.1em solid #000;
+}
+
+p.spacer-asterisk {
+    padding: 0;
+    margin: 1.5em 0;
+    text-align: center;
+}
+
+div.person-list ol {
+    list-style: none;
+    padding: 0 0 0 1.5em;
+}
+
+p.place-and-time {
+    font-style: italic;
+}
+
+em.math, em.foreign-word, em.book-title, em.didaskalia, em.author-emphasis {
+    font-style: italic;
+}
+
+em.person {
+    font-style: normal;
+    font-variant: small-caps;
+}
+
diff --git a/scripts/master.plain.css b/scripts/master.plain.css
new file mode 100644
index 0000000..3210e88
--- /dev/null
+++ b/scripts/master.plain.css
@@ -0,0 +1,160 @@
+body {
+    font-size: 16px;
+    font: Georgia, "Times New Roman", serif;
+    line-height: 1.5em;
+    margin: 3em;
+    max-width: 36em;
+}
+
+a {
+    color: blue;
+    text-decoration: none;
+}
+
+/* =================================================== */
+/* = Common elements: headings, paragraphs and lines = */
+/* =================================================== */
+h1 {
+    font-size: 3em;
+    margin: 1.5em 0;
+    text-align: center;
+    line-height: 1.5em;
+    font-weight: bold;
+}
+
+h2 {
+    font-size: 2em;
+    margin: 1.5em 0 0;
+    font-weight: bold;
+    line-height: 1.5em;
+}
+
+h3 {
+    font-size: 1.5em;
+    margin: 1.5em 0 0;
+    font-weight: normal;
+    line-height: 1.5em;
+}
+
+h4 {
+    font-size: 1em;
+    margin: 1.5em 0 0;
+    line-height: 1.5em;
+}
+
+p {
+    margin: 0;
+}
+
+/* ======================== */
+/* = Footnotes and themes = */
+/* ======================== */
+.theme-begin {
+    border-left: 0.1em solid #DDDDDD;
+    color: #666;
+    float: right;
+    margin: 0 -9.5em 0 0;
+    padding: 0 0.5em;
+    width: 7.5em;
+    font-style: normal;
+    font-weight: normal;
+    font-size: 16px;
+    display: none;
+}
+
+.annotation {
+    font-style: normal;
+    font-weight: normal;
+    font-size: 16px;
+    display: none;
+}
+
+#footnotes {
+    display: none;
+}
+
+#footnotes .annotation {
+    display: block;
+    float: left;
+    width: 2.5em;
+    clear: both;
+}
+
+#footnotes div {
+    margin: 1.5em 0 0 0;
+}
+
+#footnotes p {
+    margin-left: 2.5em;
+}
+
+/* =================== */
+/* = Custom elements = */
+/* =================== */
+span.author {
+    font-size: 0.75em;
+    display: block;
+    line-height: 1.5em;
+    margin-bottom: 0.25em;
+}
+
+span.collection {
+    font-size: 0.75em;
+    display: block;
+    line-height: 1.5em;
+    margin-bottom: -0.25em;
+}
+
+span.subtitle {
+    font-size: 0.75em;
+    display: block;
+    line-height: 1.5em;
+    margin-top: -0.25em;
+}
+
+div.didaskalia {
+    font-style: italic;
+    margin: 0.5em 0 0;
+}
+
+div.kwestia {
+    margin: 0.5em 0 0;
+}
+
+div.stanza {
+    margin: 1.5em 0 0;
+}
+
+div.kwestia div.stanza {
+    margin: 0;
+}
+
+p.paragraph {
+    text-align: justify;
+    margin: 1.5em 0 0;
+}
+
+p.motto {
+    text-align: justify;
+    font-style: italic;
+    margin: 1.5em 0 0;
+}
+
+p.motto_podpis {
+    font-size: 0.875em;
+}
+
+div.fragment {
+    border-bottom: 0.1em solid #999;
+    padding-bottom: 1.5em;
+}
+
+div.note p, div.note p.paragraph {
+    text-align: right;
+    font-style: italic;
+}
+
+hr.spacer {
+    height: 3em;
+    visibility: hidden;
+}
diff --git a/setup.py b/setup.py
new file mode 100644
index 0000000..0988321
--- /dev/null
+++ b/setup.py
@@ -0,0 +1,19 @@
+# -*- coding: utf-8 -*-
+from distutils.core import setup
+
+
+setup(
+    name='librarian',
+    version='1.1',
+    description='Converter from WolneLektury.pl XML-based language to XHTML, TXT and other formats',
+    author='Marek StÄpniowski',
+    author_email='marek@stepniowski.com',
+    url='http://redmine.nowoczesnapolska.org.pl/',
+    packages=['librarian', 'librarian.tests'],
+    package_dir={'librarian': 'librarian'},
+    package_data={
+        'librarian': ['*.xslt'],
+        'librarian.tests': ['files/dcparser/*.xml', 'files/erroneous/*.xml'],
+    },
+    scripts=['scripts/book2html', 'scripts/book2txt', 'scripts/bookfragments', 'scripts/genslugs'],
+)
-- 
2.20.1