Přejít k obsahu


A human-human train timetable dialogue corpus

Citace: [] JURČÍČEK, F., ZAHRADIL, J., JELÍNEK, L. A human-human train timetable dialogue corpus. Eurospeech, 2005, roč. 2005, č. 1, s. 1525-1528. ISSN: 1018-4074
Druh: ČLÁNEK
Jazyk publikace: eng
Anglický název: A human-human train timetable dialogue corpus
Rok vydání: 2005
Místo konání: Bonn
Název zdroje: ISCA
Autoři: Filip Jurčíček , Jiří Zahradil , Libor Jelínek
Abstrakt CZ: Tento článek popisuje vývoj dilogového korpusu člověk-člověk. Korpus obsahuje přepsanou spontání řeč telefonních hovorů na vlakové informace. Hovory se týkají dotazování na příjezdy a odjezdy vlaků, případně ceny jízdenek. Korpus je založen již na již dříve pořízeném korpusu. Korpus byl rozšířen o anotaci dialogovými akty. Dialogové akty obsahují z abstraktní sémantické anotace. Korpus obsahuje nahrávky jak operátora tak i uživatlů, ortografickou anotaci, normalizovanou anotaci, normalizovanou anotaci s pojmenovanými entitami a dialogové akty s abstraktní anotací Je navržena kombinace dialogových aktů a abstraktní sémantické anotace. Dále je posán zpusob anotace.
Abstrakt EN: This paper describes progress in a development of the humanhuman dialogue corpus. The corpus contains transcribed user’s phone calls to a train timetable information center. The phone calls consist of inquiries regarding their train traveler’s plans. The corpus is based on dialogues’s transcription of user’s inquiries that were previously collected for a train timetable information center. We enriched this transcription by dialogue act tags. The dialogue act tags comprehend abstract semantic annotation. The corpus comprises a recorded speech of both operators and users, orthographic transcription, normalized transcription, normalized transcription with named entities, and dialogue act tags with abstract semantic annotation. A combination of a dialogue act tagset and a abstract semantic annotation is proposed. A technique of dialogue act tagging and abstract semantic annotation is described and used.
Klíčová slova

Zpět

Patička