月別アーカイブ: 2024年6月

3D-Properties: Identifying Challenges in DPO and Charting a Path Forward

投稿日: 2024年6月12日作成者: jarxiv

要約大規模言語モデル (LLM) を人間の好みに合わせることが最近非常に注目を … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

CTC-based Non-autoregressive Textless Speech-to-Speech Translation

投稿日: 2024年6月12日作成者: jarxiv

要約直接音声間翻訳 (S2ST) は優れた翻訳品質を実現していますが、音声シー … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS, I.2.7 | コメントを受け付けていません

Enhancing CTC-based speech recognition with diverse modeling units

投稿日: 2024年6月12日作成者: jarxiv

要約近年、トランスフォーマーなどの深層学習アーキテクチャの進歩により、エンドツ … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

Formally Verified Approximate Policy Iteration

投稿日: 2024年6月12日作成者: jarxiv

要約対話型定理証明器 Isabelle/HOL を使用して、因数分解マルコフ決 … 続きを読む →

カテゴリー: cs.AI, cs.LO | コメントを受け付けていません

An Expert is Worth One Token: Synergizing Multiple Expert LLMs as Generalist via Expert Token Routing

投稿日: 2024年6月12日作成者: jarxiv

要約私たちは、複数のエキスパート LLM のシームレスな統合を促進する統合ジェ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

ShiftAddLLM: Accelerating Pretrained LLMs via Post-Training Multiplication-Less Reparameterization

投稿日: 2024年6月12日作成者: jarxiv

要約大規模言語モデル (LLM) は、言語タスクで優れたパフォーマンスを示して … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Ask Again, Then Fail: Large Language Models’ Vacillations in Judgment

投稿日: 2024年6月12日作成者: jarxiv

要約現在の会話言語モデルは、たとえ最初の判断が正しかったとしても、追加の質問に … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

AI Sandbagging: Language Models can Strategically Underperform on Evaluations

投稿日: 2024年6月12日作成者: jarxiv

要約信頼できる機能評価は AI システムの安全性を確保するために不可欠であり、 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CY, cs.LG | コメントを受け付けていません

BvSP: Broad-view Soft Prompting for Few-Shot Aspect Sentiment Quad Prediction

投稿日: 2024年6月12日作成者: jarxiv

要約アスペクトセンチメントクワッド予測 (ASQP) は、アスペクトター … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

ShiftAddViT: Mixture of Multiplication Primitives Towards Efficient Vision Transformer

投稿日: 2024年6月12日作成者: jarxiv

要約ビジョントランスフォーマー (ViT) は優れたパフォーマンスを示し、複 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

月別アーカイブ: 2024年6月

3D-Properties: Identifying Challenges in DPO and Charting a Path Forward

CTC-based Non-autoregressive Textless Speech-to-Speech Translation

Enhancing CTC-based speech recognition with diverse modeling units

Formally Verified Approximate Policy Iteration

An Expert is Worth One Token: Synergizing Multiple Expert LLMs as Generalist via Expert Token Routing

ShiftAddLLM: Accelerating Pretrained LLMs via Post-Training Multiplication-Less Reparameterization

Ask Again, Then Fail: Large Language Models’ Vacillations in Judgment

AI Sandbagging: Language Models can Strategically Underperform on Evaluations

BvSP: Broad-view Soft Prompting for Few-Shot Aspect Sentiment Quad Prediction

ShiftAddViT: Mixture of Multiplication Primitives Towards Efficient Vision Transformer

最近の投稿

最近のコメント

アーカイブ

カテゴリー