月別アーカイブ: 2024年6月

3D-Properties: Identifying Challenges in DPO and Charting a Path Forward

要約 大規模言語モデル (LLM) を人間の好みに合わせることが最近非常に注目を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | 3D-Properties: Identifying Challenges in DPO and Charting a Path Forward はコメントを受け付けていません

CTC-based Non-autoregressive Textless Speech-to-Speech Translation

要約 直接音声間翻訳 (S2ST) は優れた翻訳品質を実現していますが、音声シー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS, I.2.7 | CTC-based Non-autoregressive Textless Speech-to-Speech Translation はコメントを受け付けていません

Enhancing CTC-based speech recognition with diverse modeling units

要約 近年、トランスフォーマーなどの深層学習アーキテクチャの進歩により、エンドツ … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Enhancing CTC-based speech recognition with diverse modeling units はコメントを受け付けていません

Formally Verified Approximate Policy Iteration

要約 対話型定理証明器 Isabelle/HOL を使用して、因数分解マルコフ決 … 続きを読む

カテゴリー: cs.AI, cs.LO | Formally Verified Approximate Policy Iteration はコメントを受け付けていません

An Expert is Worth One Token: Synergizing Multiple Expert LLMs as Generalist via Expert Token Routing

要約 私たちは、複数のエキスパート LLM のシームレスな統合を促進する統合ジェ … 続きを読む

カテゴリー: cs.AI, cs.CL | An Expert is Worth One Token: Synergizing Multiple Expert LLMs as Generalist via Expert Token Routing はコメントを受け付けていません

ShiftAddLLM: Accelerating Pretrained LLMs via Post-Training Multiplication-Less Reparameterization

要約 大規模言語モデル (LLM) は、言語タスクで優れたパフォーマンスを示して … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | ShiftAddLLM: Accelerating Pretrained LLMs via Post-Training Multiplication-Less Reparameterization はコメントを受け付けていません

Ask Again, Then Fail: Large Language Models’ Vacillations in Judgment

要約 現在の会話言語モデルは、たとえ最初の判断が正しかったとしても、追加の質問に … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Ask Again, Then Fail: Large Language Models’ Vacillations in Judgment はコメントを受け付けていません

AI Sandbagging: Language Models can Strategically Underperform on Evaluations

要約 信頼できる機能評価は AI システムの安全性を確保するために不可欠であり、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.LG | AI Sandbagging: Language Models can Strategically Underperform on Evaluations はコメントを受け付けていません

BvSP: Broad-view Soft Prompting for Few-Shot Aspect Sentiment Quad Prediction

要約 アスペクト センチメント クワッド予測 (ASQP) は、アスペクト ター … 続きを読む

カテゴリー: cs.AI, cs.CL | BvSP: Broad-view Soft Prompting for Few-Shot Aspect Sentiment Quad Prediction はコメントを受け付けていません

ShiftAddViT: Mixture of Multiplication Primitives Towards Efficient Vision Transformer

要約 ビジョン トランスフォーマー (ViT) は優れたパフォーマンスを示し、複 … 続きを読む

カテゴリー: cs.AI, cs.LG | ShiftAddViT: Mixture of Multiplication Primitives Towards Efficient Vision Transformer はコメントを受け付けていません