PVGRU: Generating Diverse and Relevant Dialogue Responses via Pseudo-Variational Mechanism

www.lmu.de | UB | Blättern | Hilfe

Zur erweiterten Suche

English

Zur erweiterten Suche

Liu, Yongkang; Feng, Shi; Wang, Daling; Zhang, Yifei und Schütze, Hinrich (Juli 2023): PVGRU: Generating Diverse and Relevant Dialogue Responses via Pseudo-Variational Mechanism. 61st Annual Meeting of the Association for Computational Linguistics (ACL 2023), Toronto, Canada, July 2023. Rogers, Anna; Boyd-Graber, Jordan und Okazaki, Naoaki (Hrsg.): In: Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), Stroudsburg, PA: Association for Computational Linguistics (ACL). S. 3295-3310 [PDF, 885kB]

Vorschau

Creative Commons: Namensnennung 4.0 (CC-BY)

DOI: 10.18653/v1/2023.acl-long.185

Externer Volltext: https://aclanthology.org/2023.acl-long.185

Abstract

We investigate response generation for multi-turn dialogue in generative chatbots. Existing generative modelsbased on RNNs (Recurrent Neural Networks) usually employ the last hidden state to summarize the history, which makesmodels unable to capture the subtle variability observed in different dialogues and cannot distinguish the differencesbetween dialogues that are similar in composition. In this paper, we propose Pseudo-Variational Gated Recurrent Unit (PVGRU). The key novelty of PVGRU is a recurrent summarizing variable thataggregates the accumulated distribution variations of subsequences. We train PVGRU without relying on posterior knowledge, thus avoiding the training-inference inconsistency problem. PVGRU can perceive subtle semantic variability through summarizing variables that are optimized by two objectives we employ for training: distribution consistency and reconstruction. In addition, we build a Pseudo-Variational Hierarchical Dialogue(PVHD) model based on PVGRU. Experimental results demonstrate that PVGRU can broadly improve the diversity andrelevance of responses on two benchmark datasets.

Dokumententyp:	Konferenzbeitrag (Paper)
EU Funded Grant Agreement Number:	740516
EU-Projekte:	Horizon 2020 > ERC Grants > ERC Advanced Grant > ERC Grant 740516: NonSequeToR - Non-sequence models for tokenization replacement
Fakultätsübergreifende Einrichtungen:	Centrum für Informations- und Sprachverarbeitung (CIS)
Themengebiete:	400 Sprache > 400 Sprache 400 Sprache > 410 Linguistik
URN:	urn:nbn:de:bvb:19-epub-107446-6
Ort:	Stroudsburg, PA
Sprache:	Englisch
Dokumenten ID:	107446
Datum der Veröffentlichung auf Open Access LMU:	20. Okt. 2023 08:42
Letzte Änderungen:	20. Okt. 2023 08:42

Dokument bearbeiten