要約
私たちは、会話履歴とカスタマイズされたトピックを一貫した埋め込みスペースに動的に統合し、米国の大学に応募する外国人学生との 10 分間のハイブリッド ドメイン (オープンおよびクローズド) 会話を実施して、学術的および文化的準備を評価するインタビューボットを紹介します。
ニューラルベースのエンドツーエンドの対話モデルを構築するために、人間同士のインタビューの 7,361 件の音声録音が自動的に文字に起こされ、そのうち 440 件は微調整と評価のために手動で修正されます。
トランスフォーマーベースのエンコーダー/デコーダー モデルの入出力サイズ制限を克服するために、コンテキスト アテンションとトピック保存という 2 つの新しい方法が提案され、モデルが適切で一貫した相互作用を行えるようになります。
私たちの最終モデルは、インタビュー データに対する応答を比較することによって統計的にテストされ、プロのインタビュアーとさまざまな学生をリアルタイムで対話させることによって動的にテストされ、流暢さとコンテキスト認識の点で非常に満足のいくものであることがわかりました。
要約(オリジナル)
We present the InterviewBot that dynamically integrates conversation history and customized topics into a coherent embedding space to conduct 10 mins hybrid-domain (open and closed) conversations with foreign students applying to U.S. colleges for assessing their academic and cultural readiness. To build a neural-based end-to-end dialogue model, 7,361 audio recordings of human-to-human interviews are automatically transcribed, where 440 are manually corrected for finetuning and evaluation. To overcome the input/output size limit of a transformer-based encoder-decoder model, two new methods are proposed, context attention and topic storing, allowing the model to make relevant and consistent interactions. Our final model is tested both statistically by comparing its responses to the interview data and dynamically by inviting professional interviewers and various students to interact with it in real-time, finding it highly satisfactory in fluency and context awareness.
arxiv情報
著者 | Zihao Wang,Nathan Keyes,Terry Crawford,Jinho D. Choi |
発行日 | 2023-05-24 13:57:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google