Use StreamingIterator to avoid loading the whole movie file.
[audio.git] / src / archive / tasks.py
1 from datetime import datetime
2 import errno
3 import mimetypes
4 import os
5 import os.path
6 import pipes
7 import stat
8 import subprocess
9 from tempfile import NamedTemporaryFile
10 from time import sleep
11
12 from celery.task import Task
13 from django.db.models import F
14 from django.contrib.auth.models import User
15 from mutagen import File
16 from mutagen import id3
17
18 from apiclient import api_call
19 from archive.constants import status
20 from archive.models import Audiobook
21 from archive.settings import COVER_IMAGE, UPLOAD_URL
22 from archive.utils import ExistingFile
23
24
25 class AudioFormatTask(Task):
26     abstract = True
27
28     class RemoteOperationError(BaseException):
29         pass
30
31     @classmethod
32     def set_status(cls, aid, status):
33         Audiobook.objects.filter(pk=aid).update(
34             **{'%s_status' % cls.prefix: status})
35
36     @staticmethod
37     def encode(in_path, out_path):
38         raise NotImplemented
39
40     @classmethod
41     def set_tags(cls, audiobook, file_name):
42         tags = getattr(audiobook, "get_%s_tags" % cls.prefix)()['tags']
43         if not tags.get('flac_sha1'):
44             tags['flac_sha1'] = audiobook.get_source_sha1()
45         audio = File(file_name)
46         for k, v in tags.items():
47             audio[k] = v
48         audio.save()
49
50     @classmethod
51     def save(cls, audiobook, file_name):
52         field = "%s_file" % cls.prefix
53         getattr(audiobook, field).save(
54             "%d.%s" % (audiobook.pk, cls.ext),
55             ExistingFile(file_name),
56             save=False
57             )
58         os.chmod(getattr(audiobook, field).path, stat.S_IREAD|stat.S_IWRITE|stat.S_IRGRP|stat.S_IROTH)
59         Audiobook.objects.filter(pk=audiobook.pk).update(
60             **{field: getattr(audiobook, field)})
61
62     @classmethod
63     def published(cls, aid):
64         kwargs = {
65             "%s_published_tags" % cls.prefix: F("%s_tags" % cls.prefix),
66             "%s_tags" % cls.prefix: None,
67             "%s_published" % cls.prefix: datetime.now(),
68             '%s_status' % cls.prefix: None,
69         }
70         Audiobook.objects.filter(pk=aid).update(**kwargs)
71
72     @classmethod
73     def put(cls, user, audiobook, path):
74         tags = getattr(audiobook, "get_%s_tags" % cls.prefix)()
75         data = {
76             'book': tags['url'],
77             'type': cls.ext,
78             'name': tags['name'],
79             'part_name': audiobook.part_name,
80             'part_index': audiobook.index,
81             'parts_count': audiobook.parts_count,
82             'source_sha1': audiobook.source_sha1,
83         }
84         with open(path, 'rb') as f:
85             api_call(user, UPLOAD_URL, data=data, files={
86                 "file": f,
87             })
88
89     def run(self, uid, aid, publish=True):
90         aid = int(aid)
91         audiobook = Audiobook.objects.get(id=aid)
92         self.set_status(aid, status.ENCODING)
93
94         user = User.objects.get(id=uid)
95
96         out_file = NamedTemporaryFile(delete=False, prefix='%d-' % aid, suffix='.%s' % self.ext)
97         out_file.close()
98         self.encode(audiobook.source_file.path, out_file.name)
99         self.set_status(aid, status.TAGGING)
100         self.set_tags(audiobook, out_file.name)
101         self.set_status(aid, status.SENDING)
102
103         if publish:
104             self.put(user, audiobook, out_file.name)
105             self.published(aid)
106         else:
107             self.set_status(aid, None)
108
109         self.save(audiobook, out_file.name)
110
111     def on_failure(self, exc, task_id, args, kwargs, einfo):
112         aid = (args[0], kwargs.get('aid'))[0]
113         self.set_status(aid, None)
114
115
116 class Mp3Task(AudioFormatTask):
117     prefix = ext = 'mp3'
118
119     # these shouldn't be staticmethods
120     def id3_text(tag, text):
121         return tag(encoding=3, text=text)
122     def id3_url(tag, text):
123         return tag(url=text)
124     def id3_comment(tag, text, lang='pol'):
125         return tag(encoding=3, lang=lang, desc='', text=text)
126     def id3_priv(tag, text, what=''):
127         return tag(owner='wolnelektury.pl?%s' % what, data=text.encode('utf-8'))
128
129     TAG_MAP = {
130         'album': (id3_text, id3.TALB),
131         'albumartist': (id3_text, id3.TPE2),
132         'artist': (id3_text, id3.TPE1),
133         'conductor': (id3_text, id3.TPE3),
134         'copyright': (id3_text, id3.TCOP),
135         'date': (id3_text, id3.TDRC),
136         'genre': (id3_text, id3.TCON),
137         'language': (id3_text, id3.TLAN),
138         'organization': (id3_text, id3.TPUB),
139         'title': (id3_text, id3.TIT2),
140         'comment': (id3_comment, id3.COMM, 'pol'),
141         'contact': (id3_url, id3.WOAF),
142         'license': (id3_url, id3.WCOP),
143         'flac_sha1': (id3_priv, id3.PRIV, 'flac_sha1'),
144         'project': (id3_priv, id3.PRIV, 'project'),
145         'funded_by': (id3_priv, id3.PRIV, 'funded_by'),
146     }
147
148     @staticmethod
149     def encode(in_path, out_path):
150         # 44.1kHz 64kbps mono MP3
151         subprocess.check_call(['ffmpeg', 
152             '-i', in_path.encode('utf-8'),
153             '-ar', '44100',
154             '-ab', '64k',
155             '-ac', '1',
156             '-y',
157             '-acodec', 'libmp3lame',
158             out_path.encode('utf-8')
159             ])
160
161     @classmethod
162     def set_tags(cls, audiobook, file_name):
163         mp3_tags = audiobook.get_mp3_tags()['tags']
164         if not mp3_tags.get('flac_sha1'):
165             mp3_tags['flac_sha1'] = audiobook.get_source_sha1()
166         audio = id3.ID3(file_name)
167         for k, v in mp3_tags.items():
168             factory_tuple = cls.TAG_MAP[k]
169             factory, tagtype = factory_tuple[:2]
170             audio.add(factory(tagtype, v, *factory_tuple[2:]))
171
172         if COVER_IMAGE:
173             mime = mimetypes.guess_type(COVER_IMAGE)
174             with open(COVER_IMAGE, 'rb') as f:
175                 audio.add(id3.APIC(encoding=0, mime=mime, type=3, desc='', data=f.read()))
176
177         audio.save()
178
179
180 class OggTask(AudioFormatTask):
181     prefix = ext = 'ogg'
182
183     @staticmethod
184     def encode(in_path, out_path):
185         # 44.1kHz 64kbps mono Ogg Vorbis
186         subprocess.check_call(['ffmpeg', 
187             '-i', in_path.encode('utf-8'),
188             '-ar', '44100',
189             '-ab', '64k',
190             '-ac', '1',
191             '-y',
192             '-acodec', 'libvorbis',
193             out_path.encode('utf-8')
194             ])