Beiträge

Eine Audiobook-Version für lernOS Leitfäden mit Open Source Anwendungen

Audiobooks sind mit Plattformen wie Amazon Unlimited oder Audible ein großer Trend geworden. Dort kann man sich gelesene Versionen von Büchern herunterladen und unterwegs anhören. Ende März hat Asja auf Twitter die Frage aufgebracht, ob man so ein Audiobook nicht auch für lernOS Leitfäden anbieten könnte:

Da die Inhalte gemäß einer agilen Entwicklungsmethode alle drei Monate in einer neuen Version erscheinen, ist das Einlesen der Texte von menschlichen Sprechern nicht realistisch – außer wir finden einen Sponsor, der uns regelmäßig Rufus Beck finanziert :-)

Also habe ich mich mal auf die Suche nach freien Sprachsynthese-Anwendungen begeben. Gedanklich waren die Anforderungen an die Anwendung ungefähr so (es gab kein Lastenheft):

  • Freie Software, damit alle damit experimentieren können
  • Verfügbarkeit gut klingender Stimmen
  • Kommandozeilen-Tool, damit wir es in unseren automatisierten Produktionsprozess einbinden können
  • Export-Funktion als MP3, idealerweise weiterer Audio-Formate
  • Kapitelmarken-Funktion, damit die Kapitel im Leitfaden auch im Audiobook einzeln ansteuerbar sind

Getestet haben wir z.B. auch, Siri auf dem iPhone den Leitfaden vorlesen zu lassen und dass dann über ein Audio-Interface aufzunehmen. Schließlich haben wir uns dann für die Freeware-Anwendung Balabolka entschieden.

Balabolka setzt auf dem Windows Speech Application Programming Interface (SAPI) auf. Dadurch kann auf eine Vielzahl kostenloser und kostenpflichtiger Stimmen zurückgegriffen werden. Für SAPI 5 sind noch nicht so viele Stimmen verfügbar, wie für SAPI 4, das wird sich aber in Zukunft noch ändern.

Balabolka kann Text aus einer großen Auswahl von Quellen einlesen, darunter die Zwischenablage und Dateiformate wie DOC, EPUB, HTML, MOBI, HTML und PDF. Da wir die lernOS Leitfäden auch in den eBook-Formate EPUB und MOBI erstellen, kam uns diese Flexibilität sehr entgegen. Die synthetisierten Texte können dann in den Audio-Formaten WAV, MP3, OGG und WMA abgespeichert werden. Perfekt.

Ich habe jetzt mal die deutsche und englische Version des lernOS for You Leitfaden als MP3 erstellt (Laufzeit ca. 1h, Größe ca. 50 MByte). Um für die experimentellen Audiobooks eine kompakte Seite mit Player und Feedback-Option zu erhalten, habe ich beide Dateien auf archive.org hochgeladen:

Es ist natürlich klar, dass die Sprachsynthese nicht an die Lösung mit Rufus Beck heranreicht. Aber hört bitte trotzdem mal rein und schreibt auf der Seite unten eine sog. Rezension mit eurem Feedback. Meine Frage ist, ob wir dieses Art Audiobooks bei den Leitfäden mal mit anbieten sollen, oder ob das noch zu weit von brauchbar entfernt ist.

Nachbereitung von Livesession-Aufnahmen in MOOCs und SPOCs

Gerade läuft der Cross Company Course on Guide or Multiplier Networks (CCCGOMN), in dem genau wie im Management 2.0 MOOC im Jahr 2013 auch wöchentliche Livesessions gemacht werden. Den Teilnehmern wird im Nachgang die Videoaufnahme (mp4) und zusätzlich eine Audioaufnahme (mp3) bereitgestellt. Dieser Beitrag beschreibt kurz, wie der Prozess der Nachbereitung erfolgt.

Folgende Schritte verwende ich nach den Livesessions (Dauer: ca. 1h):

  • Videokonferenz-Tools wie GoToMeeting oder Skype for Business erzeugen als Aufnahme meist eine mp4-Datei, die ich als Ausgangsbasis verwende
  • Die mp4-Datei imporiere ich in ein Videoschnitt-Programm, in meinem Fall das kostenlose DaVinci Resolve
  • Im Videoschnitt-Programm trimme ich Anfang und Ende und schneide alle Stellen, an denen Längen durch Wechsel zwischen den Rerferenten oder technische Probleme entstehen. Für schnelles Arbeiten ist es sinnvoll, sich die Tastaturkürzel des verwendeten Programms anzusehen
  • Das geschnittene Ergebnis exportiere ich als mp4-Datei mit einer maximalen Datenrate von 2000 kBit/s (Achtung: viele Programme schlagen deutlich höhere Datenraten vor, was bei Livesession-Aufzeichnungen aber nicht sinnvoll ist, da es die Dateigröße deutlich vergrößert
  • Danach erzeuge ich mit dem Kommandozeilen-Tool FFmpeg aus der mp4-Datei eine mp3-Datei (Audio)
  • Beide Dateien lade ich in unsere Plattform Coshare und verlinke sie mit der entsprechenden Seite des Kurses für den Download
  • Fertig :-)

Wenn Ihr auch interessante Workflows habt, die Euch Zeit sparen, könnt Ihr die gerne in den Kommentaren kurz beschreiben.