Přejít k obsahu


Audiovizuální korpus z Mistrovství světa v ledním hokeji 2011

Citace: PSUTKA JR., J., PRAŽÁK, A., IRCING, P., VANĚK, J. Audiovizuální korpus z Mistrovství světa v ledním hokeji 2011. 2013.
Druh: SOFTWARE
Jazyk publikace: cze
Anglický název: Audiovisual Corpus from the 2011 Ice Hockey World Championship
Rok vydání: 2013
Název zdroje: Západočeská univerzita v Plzni
Autoři: Ing. Mgr. Josef Psutka jr. Ph.D. , Ing. Aleš Pražák Ph.D. , Ing. Pavel Ircing Ph.D. , Ing. Jan Vaněk Ph.D.
Abstrakt CZ: Korpus sestává z audiovizuálních nahrávek vybraných přenosů (v češtině) z Mistrovství světa v ledním hokeji konaného v roce 2011. Obsahuje kompletní sadu osmifinálových, čtvrtfinálových, semifinálových a finálových zápasů (včetně utkání o třetí místo) + všechny zápasy českého týmu v základní skupině. Korpus obsahuje celkem 67.5 hodiny řeči. Obsah audiostopy je téměř kompletně přepsán (s výjimkou komerčních sdělení, znělek apod.). Přepis má 430 tisíc tokenů a jeho slovník obsahuje 29 tisíc slov. Informace o identitě řečníka není v anotaci obsažena. Vizuální složka nahrávka žádným způsobem anotována není.
Abstrakt EN: The corpus consists of audiovisual recordings of selected Czech broadcasts from 2011 Ice Hockey World Championship. It contains complete eighth-final, quarter-final, semifinal and final matches (including the third place playoff) + all matches of the Czech team in the group). The corpus contains 67.5 hours of speech in total. The speech is completely transcribed (excluding the unrelated content ? commercials, jingles, etc.). The transcript has 430,000 tokens and 29,000 types (lexicon items). Information about the speakers? identity is not provided. The visual information contained in the corpus is not annotated in any way.
Klíčová slova

Zpět

Patička