fix expected html output to contain secX anchors

[librarian.git] / librarian / packagers.py
diff --git a/librarian/packagers.py b/librarian/packagers.py

index 285a15f..ddfd7c8 100644 (file)
--- a/librarian/packagers.py
+++ b/librarian/packagers.py
@@ -6,8 +6,8 @@
  import os
  from copy import deepcopy
  from lxml import etree
-from librarian import epub, pdf, DirDocProvider, ParseError, cover
-from librarian.dcparser import BookInfo
+from librarian import pdf, epub, DirDocProvider, ParseError, cover
+from librarian.parser import WLDocument
  
  
  class Packager(object):
@@ -26,8 +26,11 @@ class Packager(object):
              except:
                  pass
          outfile = os.path.join(output_dir, slug + '.' + cls.ext)
-        cls.converter.transform(provider, file_path=main_input, output_file=outfile,
+
+        doc = WLDocument.from_file(main_input, provider=provider)
+        output_file = cls.converter.transform(doc,
                  cover=cls.cover, flags=cls.flags)
+        doc.save_output_file(output_file, output_path=outfile)
  
  
      @classmethod
@@ -57,6 +60,9 @@ class PdfPackager(Packager):
  class GandalfEpubPackager(EpubPackager):
      cover = cover.GandalfCover
  
+class GandalfPdfPackager(PdfPackager):
+    cover = cover.GandalfCover
+
  class BookotekaEpubPackager(EpubPackager):
      cover = cover.BookotekaCover
  
@@ -69,13 +75,12 @@ class PrestigioPdfPackager(PdfPackager):
      flags = ('less-advertising',)
  
  
-class VirtualoEpubPackager(Packager):
+class VirtualoPackager(Packager):
      @staticmethod
      def utf_trunc(text, limit):
          """ truncates text to at most `limit' bytes in utf-8 """
          if text is None:
              return text
-        orig_text = text
          if len(text.encode('utf-8')) > limit:
              newlimit = limit - 3
              while len(text.encode('utf-8')) > newlimit:
@@ -113,7 +118,8 @@ class VirtualoEpubPackager(Packager):
                  outfile_dir = os.path.join(output_dir, slug)
                  os.makedirs(os.path.join(output_dir, slug))
  
-                info = BookInfo.from_file(main_input)
+                doc = WLDocument.from_file(main_input, provider=provider)
+                info = doc.book_info
  
                  product_elem = deepcopy(product)
                  product_elem[0].text = cls.utf_trunc(slug, 100)
@@ -124,14 +130,20 @@ class VirtualoEpubPackager(Packager):
                  product_elem[4][0][1].text = cls.utf_trunc(info.author.last_name, 100)
                  xml.append(product_elem)
  
-                cover.VirtualoCover(
-                    u' '.join(info.author.first_names + (info.author.last_name,)),
-                    info.title
-                    ).save(os.path.join(outfile_dir, slug+'.jpg'))
+                cover.VirtualoCover(info).save(os.path.join(outfile_dir, slug+'.jpg'))
                  outfile = os.path.join(outfile_dir, '1.epub')
                  outfile_sample = os.path.join(outfile_dir, '1.sample.epub')
-                epub.transform(provider, file_path=main_input, output_file=outfile)
-                epub.transform(provider, file_path=main_input, output_file=outfile_sample, sample=25)
+                doc.save_output_file(doc.as_epub(),
+                        output_path=outfile)
+                doc.save_output_file(doc.as_epub(doc, sample=25), 
+                        output_path=outfile_sample)
+                outfile = os.path.join(outfile_dir, '1.mobi')
+                outfile_sample = os.path.join(outfile_dir, '1.sample.mobi')
+                doc.save_output_file(doc.as_mobi(cover=cover.VirtualoCover),
+                        output_path=outfile)
+                doc.save_output_file(
+                        doc.as_mobi(doc, cover=cover.VirtualoCover, sample=25), 
+                        output_path=outfile_sample)
          except ParseError, e:
              print '%(file)s:%(name)s:%(message)s' % {
                  'file': main_input,