Gute Inhalte gezielt finden – Audio Mining für Mediatheken

„Audio-Mining“ - Suche in Audio- und Videodaten
Das Audio-Mining-System mit automatischer Spracherkennung erlaubt es Anbietern von Mediatheken, ihre Bestände für Nutzer automatisch durchsuchbar zu machen, die Reichweite der Inhalte zu erhöhen und für weitere Anwendungen zu erschließen.
Kundennutzen
Die Spracherkennung trägt nicht nur zur Verbesserung der Suchfunktion bei, sie kann auch für weitere Optimierungen genutzt werden: Auf Basis der gesprochenen Wörter werden die Inhalte mit automatisch erzeugten Schlagworten angereichert und zu ähnlichen Inhalten in Beziehung gesetzt. So können dem Nutzer Empfehlungen gegeben werden, die ihn auf weitere für ihn interessante Inhalte hinweisen. Die Verweildauer des Nutzers wird so verlängert und auch ältere, nicht mehr populäre Inhalte werden noch abgerufen.
Funktionalität
Automatische Aufbereitung von Audio-Medienbeständen
Mit der automatischen Sprach-Erkennung („speech-to-text“) können Audiodaten für die Suche aufbereitet und automatisch verschlagwortet werden. Dabei werden auch verschiedene Sprecher erkannt und Sprache von anderen Audion-Daten (Musik, Geräusche) unterschieden. Die Metadaten der Audio-Dateien können entsprechend angereichert werden, um vorhandene Suchfunktionen zu unterstützen.
Mediathek-Suche
Nutzer können die Audiobestände nach Schlagworten durchsuchen und bekommen passende Sendungen/Dateien angezeigt.
Empfehlungen
Nutzer bekommen durch die eingebaute Recommendation-Technologie inhaltsbasiert weitere verwandte Treffer angezeigt.
In-clip-Suche
Innerhalb einer Audio-Datei können Nutzer nach Begriffen suchen und einfach an die passenden Stellen springen.
Webservice-API
Durch eine flexible Web-Service Schnittstelle ist das Produkt einfach in bestehende Systeme zu integrieren.
Audiovisuelle Analysetools
Mit unserem Audio-Mining-System finden Journalisten und Medienbeobachter zeitgenau Zitate, Stichworte und Themen in audiovisuellen Inhalten. Sie bedienen das System wie eine herkömmliche Suchmaschine. Audio Mining führt immer direkt an die Stelle, an der der Suchbegriff gesprochen wurde.
Dies ermöglicht unsere Spracherkennung, die automatisch das gesprochene Wort in Text überführt. Dabei werden nicht nur die einzelnen Wörter selbst, sondern auch die Zeitinformationen zu jedem Wort erfasst. Zusätzlich zur Sprache wird die Struktur des Audiosignals analysiert. Geräusche, Musik und einzelne Sprecher werden voneinander unterschieden. Diese Daten erleichtern den Zugang zum Medium, man springt von Segment zu Segment.
© Foto Fraunhofer IAIS
Segmentierung einer Audiodatei mit verschiedenen Sprechern (farbig markiert) und Worttreffern (Dreiecke)
Zielgruppen
Redaktionen
Für die Medienbeobachtung können Sendungen direkt mit nur geringer Zeitverzögerung analysiert und für die Bearbeitung vorbereitet werden.
Anbieter von Mediatheken
Provider von Video-Datenbanken können ihre Such-Funktionalität substantiell erweitern und ihren Nutzern ein wesentlich verbessertes Erlebnis anbieten.
Rundfunk- und Fernsehsender
Interne Audio-Archive können mit Audio-Mining für die interne Suche erschlossen werden.
Flexible Integration durch Webservices
Bei der Entwicklung des Audio-Mining-Systems wurde konsequent auf einfache Webservice-Schnittstellen geachtet. Dadurch lässt es sich mit geringem Aufwand in jede Systemlandschaft integrieren.