MediaCategorizer

Benutzerhandbuch

Autor Tobias Kiertscher kiertscher@fh-brandenburg.de Fachhochschule Brandenburg
Datum 29.04.2014
Version 0.6.0

Einleitung

MediaCategorizer ist eine Windows-Desktop-Anwendung zur Verschriftlichung von Audio- und Videomedien und der automatischen Zuordnung dieser Medien zu benutzerdefinierten Kategorien.

Technische Voraussetzungen

Für den Betrieb von MediaCategorizer wird ein PC mit Microsoft Windows 7 Professional oder Enterprise und deutscher Benutzeroberfläche als Betriebssystem benötigt. (Es genügt evtl. nicht, ein Windows mit anderer Sprache durch die Installation eines Sprachpakets auf Deutsch umzustellen, da in einem deutschen Sprachpaket evtl. nicht die Deutschen Wörterbücher für die Spracherkennung enthalten sind.)

Für die Darstellung der Prozessergebnisse ist ein Browser erforderlich. Die Ergebnisse wurden mit Mozilla Firefox (Version 25) und Microsoft Internet Explorer 10 getestet.

Der Rechenaufwand und Arbeitsspeicherbedarf ist abhängig von der Anzahl und Länge der verarbeiteten Medien. Es wird empfohlen mindestens 3 GB RAM und eine CPU mit mindestens 2 Kernen zu verwenden. MediaCategorizer ist so implementiert, dass mehrere Prozessorkerne effektiv genutzt werden. Das bedeutet, dass sich die Verarbeitungszeit bei Projekten mit mehreren Medien durch den Einsatz eines Mehrprozessorsystems deutlich reduziert.

Installation

MediaCategorizer benötigt sowohl das Microsoft .NET-Framework 4.5 als auch eine Java 7 Laufzeitumgebung.

MediaCategorizer benötigt keine Registrierung im Betriebssystem. Das bedeutet, dass es nicht durch das Ausführen eines Setup-Programms installiert werden muss, sondern einfach durch Kopieren des Anwendungsverzeichnisses installiert wird. MediaCategorizer kann z.B. im Verzeichnis C:\MediaCategorizer installiert werden oder in C:\User\<Benutzer>\Documents\MediaCategorizer.

Es kann, falls gewünscht, eine Verknüpfung zum Start von MediaCategorizer auf dem Desktop platziert werden. Dafür kann die Datei MediaCategorizer.exe im Installationsverzeichnis aus einem Explorer-Fenster bei gedrückter Alt-Taste auf den Desktop gezogen werden.

Nach erfolgreicher Installation von MediaCategorizer müssen Sprecherprofile in Windows eingerichtet werden. Dazu dienen die Anweisungen im Dokument MediaCategorizer - Sprecherprofilverwaltung.

Benutzeroberfläche

Die Benutzeroberfläche von MediaCategorizer gliedert sich die die folgenden drei Bereiche (siehe Abbildung 1).

Abbildung 1: Die allgemeine Aufteilung der Benutzeroberfläche
Abbildung 1: Die allgemeine Aufteilung der Benutzeroberfläche

Am oberen Fensterrand befindet sich das Projektmenü, mit dessen Hilfe Projekte angelegt, gespeichert und wieder geöffnet werden können. Am rechten Ende des Projektmenüs befindet sich ein Eintrag für die Programmeinstellungen und ein Eintrag für die Infoseite. Ganz rechts führt das Hilfe-Symbol zur Online-Hilfe im Standardbrowser.

Am rechten Fensterrand befindet sich das Prozessmenü. Mit dem Prozessmenü wird zwischen den verschiedenen Seiten eines Projektes umgeschaltet.

Im übrigen Bereich des Fensters wird die jeweils aktive Seite angezeigt.

Projektseiten

Die verschiedenen Aspekte eines Projektes sind auf die folgenden Seiten verteilt.

Die Seiten können in beliebiger Reihenfolge über das Prozessmenü aufgerufen werden.

Start

Auf der Startseite eines Projekt kann für das Projekt ein Name und eine Beschreibung angegeben werden (siehe Abbildung 2). Darüber hinaus wird auf der Startseite ein absoluter oder relativer Pfad für das Ausgabeverzeichnis angegeben. In diesem Verzeichnis werden die Prozessergebnisse gespeichert.

Wird ein relativer Pfad für das Ausgabeverzeichnis angegeben, bezieht sich dieser auf die Position der Projektdatei im Dateisystem. Deshalb muss das Projekt gespeichert werden, bevor die Ausführung des Prozesses gestartet wird.

Abbildung 2: Die Startseite eines Projektes
Abbildung 2: Die Startseite eines Projektes

Kategorien

Auf der Seite Kategorien können die Kategorien für das Projekt definiert werden (siehe Abbildung 3). Die Schaltflächen Kategorie hinzufügen und Kategorie entfernen können verwendet werden, um der Liste neue Einträge hinzuzufügen oder einen oder mehrere markierte Einträge zu löschen. Ein Klick auf eine Zeile der Tabelle markiert die Zeile und damit die entsprechende Kategorie, ein weiterer Klick auf eine Zelle in dieser Zeile schaltet die Zelle in den Bearbeitungsmodus. Auf diese Weise können die ID und der Name einer Kategorie bearbeitet werden.

Abbildung 3: Die Kategorien eines Projektes
Abbildung 3: Die Kategorien eines Projektes

Durch das Markieren einer Kategorie werden die Ressourcen dieser Kategorie in der unteren Tabelle angezeigt.

Die ID einer Kategorie darf keine Leer- oder Sonderzeichen enthalten und sollte möglichst kurz gewählt werden. Der Name sollte die Kategorie möglichst aussagekräftig beschreiben. Er wird in der Prozessausgabe zur Beschriftung der Kategorie verwendet.

Die Ressourcen einer Kategorie werden verwendet, um die Wortliste der Kategorie zu erzeugen. Ressourcen können über die Schaltflächen Ressource(n) hinzufügen und Ressource(n) entfernen bearbeitet werden. Nach einem Klick auf die Schaltfläche Ressource(n) hinzufügen wird ein Auswahldialog angezeigt, in dem zwischen lokalen Resourcen und Web-Resourcen gewählt werden kann. Wird Lokale Datei ausgewählt, kann eine oder mehrere Datei im lokalen Dateisystem als Ressource ausgewählt werden. Wird Webserver ausgewählt, öffnet sich ein Browser-Fenster in dem eine Webseite aufgrufen werden kann. Mit der Schaltfläche Adresse übernehmen wird die aktuell angezeigte Seite der Kategorie als Web-Resource hinzugefügt und das Browser-Fenster geschlossen.

Jede Ressource wird durch einen Typ und eine URL definiert. Es gibt drei Typen von Ressourcen:

Die URL einer Ressource gibt den Pfad zu der Ressource an. Die URL kann auch direkt bearbeitet werden. Für eine Wikipedia-Seite zum Begriff Betriebssystem kann z.B. die URL http://de.wikipedia.org/wiki/Betriebssystem verwendet werden. Wenn eine Datei aus dem lokalen Dateisystem gewählt wurde, wird dem Pfad file:/// vorangestellt. So kann die Datei C:\Users\Nutzer1\Documents\Stichworte.txt z.B. mit der URL file:///C:\Users\Nutzer1\Documents\Stichworte.txt angegeben werden.

Werden in einem Projekt keine Kategorien angegeben, wird für die Prozessausgabe keine Zuordnung zwischen Kategorien und Medien berechnet.

Medien

Auf der Seite Medien werden die Mediendateien angegeben, die in dem Prozess verarbeitet werden sollen (siehe Abbildung 4).

Abbildung 4: Die Medienliste eines Projektes
Abbildung 4: Die Medienliste eines Projektes

Medien werden mit einer ID, einem Namen und dem lokalen Pfad zu einer Mediendatei beschrieben. Die ID darf keine Leer- oder Sonderzeichen enthalten und sie sollte möglichst kurz gewählt werden. Der Name sollte das Medium aussagekräftig beschreiben, er wird in der Prozessausgabe zur Beschriftung des Mediums verwendet.

Einträge werden in der Medienliste mit den Schaltflächen Medien hinzufügen und Medien entfernen verwaltet.

Einfacher als das manuelle Hinzufügen von Einträgen zur Liste ist jedoch die Nutzung der Drag&Drop-Unterstützung. Dazu können ein oder mehrere Dateien oder Ordner aus einem Explorer-Fenster auf die Liste gezogen werden. Dabei werden alle Ordner nach kompatiblen Mediendateien durchsucht und passende Einträge in der List erzeugt. Der Name wird aus dem Dateinamen gewonnen und die ID wird als fortlaufende Nummer generiert.

Parameter

Die Seite Parameter führt eine Reihe von Einstellungen auf, die den Prozess steuern (siehe Abbildung 5).

Abbildung 5: Die Parametereinstellung eines Projektes
Abbildung 5: Die Parametereinstellung eines Projektes

Sprecherprofile

Auf der Seite Sprecherprofile wird eine Tabelle mit allen in Windows installierten Sprecherprofilen angezeigt. Die Tabelle besitzt die drei Spalten Name, Aktiviert und ID. Mit den Häkchen in der Spalte Aktiviert können die Sprecherprofile für die Ausführung des Projektes aktiviert oder deaktiviert werden. Die Spalte ID enthält die GUID, mit der das jeweilige Sprecherprofil in der Registry von Windows identifiziert wird.

Je mehr Profile für die Ausführung eines Projektes aktiviert sind, desto höher ist die Wahrscheinlichkeit, dass gute Spracherkennungsergebnisse erzielt werden. Jedoch führt die Aktivierung von vielen Sprecherprofilen i.d.R. zu einer längeren Verarbeitungszeit.

Hinweis: Die Auswahl der aktiven Sprecherprofile wird nicht im Projekt gespeichert. Beim Öffnen eines bestehenden Projektes oder dem Erzeugen eines neuen Projektes werden automatisch alle Sprecherprofile für die Verarbeitung aktiviert. Achten Sie vor dem Starten der Ausführung darauf, dass Sie nur jene Sprecherprofile aktivieren, die Sie benötigen.

Abbildung 6: Die Liste mit den verfügbaren Sprecherprofilen
Abbildung 6: Die Liste mit den verfügbaren Sprecherprofilen

Ausführung

Auf der Seite Ausführung kann der Prozess gestartet und der Fortschritt der Ausführung beobachtet werden. Sie besteht aus einem Kopfbereich der den globalen Fortschritt der Ausführung anzeigt, eine Liste mit Aufgaben und am Fuß eine Schaltfläche zum Starten des Projektes.

Abbildung 7: Die Fortschrittsanzeige während der Ausführung des Prozesses
Abbildung 7: Die Fortschrittsanzeige während der Ausführung des Prozesses

Die Aufgabenliste besteht aus drei Bereichen:

Programmeinstellungen

Durch den Eintrag Einstellungen im Projektmenü oben rechts, gelangt man auf die Seite Einstellungen. Auf dieser Seite werden Projektübergreifende Programmeinstellungen festgelegt. Diese Einstellungen werden in der Datei MediaCategorizer.setup.xml im Programmverzeichnis von MediaCategorizer gespeichert.

Abbildung 8: Die Programmeinstellungen von MediaCategorizer
Abbildung 8: Die Programmeinstellungen von MediaCategorizer

Die folgenden Einstellungen stehen zur Verfügung:

Infoseite

Die Infoseite wird über den Eintrag Info im Projektmenü rechts oben aufgerufen. Sie enthält Versions- und Lizenzinformationen zu MediaCategorizer (siehe Abbildung 9). Ein Link führt auf die Projekt-Website.

Abbildung 9: Die Infoseite von MediaCategorizer
Abbildung 9: Die Infoseite von MediaCategorizer

Prozessergebnisse

Nach erfolgreicher Prozessausführung wurden die Ergebnisse im Ausgabeverzeichnis des Projektes gespeichert.

Verzeichnisstruktur

Die Ergebnisse werden in der folgenden Verzeichnisstruktur gespeichert:

Welche Teile der Ausgabe erzeugt werden hängt von den Projektparametern in der Parametergruppe Ausgabe ab: Ergebnis visualisieren, Keine Übereinstimmungsdetails, Keine Wortseiten, Keine Wortwolken und Mediendateien nicht kopieren.

Weitere Details zum Aufbau der Ergebnis-Website sind im Dokument Struktur der Ergebniswebseite zu finden.

Website

Die Website mit den Prozessergebnissen kann mit der Datei index.html in einem Browser aufgerufen werden.

Die Seite besitzt ein Hauptmenü und ein Ansichtsmenü (siehe Abbildung 10). Über das Hauptmenü kann zwischen den allgemeinen Projektergebnissen, der Kategorieliste und der Medienliste umgeschaltet werden. Die Kategorieliste führt zu den Kategorie-spezifischen Ergebnissen und die Medienliste führt zu den Medien-spezifischen Ergebnissen. Damit gibt es drei unterschiedliche Kontexte: Projekt, Kategorie und Medium. Das Ansichtsmenü erlaubt den Wechsel zwischen den verschiedenen Ansichten des jeweiligen Kontexts.

Abbildung 10: Die Startseite der Prozessergebnisse
Abbildung 10: Die Startseite der Prozessergebnisse

Die unterschiedlichen visuellen Darstellungen sind mit erläuternden Texten versehen, so dass die Website weitgehend selbsterklärend ist.

Das Ausgabeverzeichnis kann auf jedem Webserver veröffentlicht werden, der statische Inhalte vom Dateisystem ausliefern kann und die Datei index.html als Startseite für ein Verzeichnis erkennt.

Falls vorhanden, sollten die folgenden Dateien und Verzeichnisse nicht veröffentlicht werden:

Ob die Datei result.xml veröffentlicht werden soll hängt davon ab, ob die maschinenlesbaren Ergebnisse über die Website abrufbar sein sollen.

Bei der Veröffentlichung ist zu beachten, dass je nach Größe der Mediendateien erheblicher Speicherplatzbedarf entsteht.