Přejít k obsahu


Analyzér desynchronizace obrazové a syntetizované zvukové stopy TV vysílání

Citace:
HANZLÍČEK, Z., TIHELKA, D. Analyzér desynchronizace obrazové a syntetizované zvukové stopy TV vysílání. 2011.
Druh: SOFTWARE
Jazyk publikace: cze
Anglický název: Tools for analysis of desynchronisation between video and synthesised audio track in TV broadcasting
Rok vydání: 2011
Název zdroje: Katedra kybernetiky, Fakulta aplikovaných věd, Západočeská univerzita v Plzni
Autoři: Ing. Zdeněk Hanzlíček Ph.D. , Ing. Daniel Tihelka Ph.D.
Abstrakt CZ: Jde o nástroj, jehož cílem je analyzovat potenciální míru desynchronizace obrazové a syntetizované zvukové stopy pro dané televizní pořady. Syntetizovaná zvuková stopa obsahuje řeč vytvářenou počítačovým syntetizérem (systémem TTS), jehož vstupem jsou skryté titulky k danému pořadu (vysílané na teletextu 888). V závislosti na typu pořadu (rychlosti dialogů) nejsou systémy TTS vždy schopny dodržet požadované časování. Nástroj tedy analyzuje, jakým způsobem se bude rozbíhat časování uměle vytvářené zvukové stopy oproti zobrazování odpovídajících titulků. Nástroj je rozdělen do dvou modulů: první simuluje vytváření řeči z daných titulků a vytváří záznam o trvání a časovém rozložení této řeči; druhý modul tento záznam zpracovává. Analýzou velkého množství titulků pro různé druhy pořadů (a žánrů) je možné získat statistické údaje o desynchronizaci řeči vůči titulkům, na jejichž základě lze pak optimálně naladit systém TTS a off-line upravit tempo řeči nezávisle pro jednotlivé hlasu použité k syntéze tak, aby byla zvuková stopa plně synchronizovaná a současně nedocházelo k příliš velkému zrychlování řeči (což by bylo v rozporu s cílem projektu).
Abstrakt EN: This software tool is used for analysis of potential level of desynchronisation between video and synthesized audio track for the given TV programs. The synthesized audio track contains speech generated by a speech synthesizer (TTS system). The input of that TTS system are the subtitles belonging to the given program. According to the type of program, TTS system are not always capable to keep the required timing. This tool calculates the difference between the timing of generated audio track and of the default subtitles. The tool is composed of two basic modules: the first one emulates the synthesis of speech from given subtitles and generates a record of the duration and timing of that speech. The second module processes this record and calculates various statistical indices on speech and subtitles desynchronisation. By analysis of a large amount of subtitles for various types of programes, important statistics for optimal settings of the TTS system can be obtained. As a result, the speech rate for particular voices can be modified to produce a fully synchronised audio track.
Klíčová slova

Zpět

Patička