月別アーカイブ: 2024年5月

Sparse Matrix in Large Language Model Fine-tuning

投稿日: 2024年5月27日作成者: jarxiv

要約 LoRA とそのバリアントは、過剰な計算コストを回避できるため、パラメータ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

MeteoRA: Multiple-tasks Embedded LoRA for Large Language Models

投稿日: 2024年5月27日作成者: jarxiv

要約事前トレーニング + 微調整パラダイムは、さまざまなダウンストリームアプ … 続きを読む →

カテゴリー: cs.AI, cs.CL, I.2.7 | コメントを受け付けていません

JsonTuning: Towards Generalizable, Robust, and Controllable Instruction Tuning

投稿日: 2024年5月27日作成者: jarxiv

要約命令チューニングは、大規模言語モデル (LLM) のパフォーマンスを最適化 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Certifiably Robust RAG against Retrieval Corruption

投稿日: 2024年5月27日作成者: jarxiv

要約検索拡張生成 (RAG) は、検索破損攻撃に対して脆弱であることがわかって … 続きを読む →

カテゴリー: cs.CL, cs.CR, cs.LG | コメントを受け付けていません

StrategyLLM: Large Language Models as Strategy Generators, Executors, Optimizers, and Evaluators for Problem Solving

投稿日: 2024年5月27日作成者: jarxiv

要約既存のプロンプト手法のほとんどは、他のインスタンスには適用できないインスタ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Synergizing In-context Learning with Hints for End-to-end Task-oriented Dialog Systems

投稿日: 2024年5月27日作成者: jarxiv

要約少数ショット (コンテキスト内) 学習を使用して構築された大規模言語モデル … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Profiling checkpointing schedules in adjoint ST-AD

投稿日: 2024年5月27日作成者: jarxiv

要約チェックポイントは、随伴アルゴリズム微分におけるデータフロー逆転の基礎で … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Text Generation: A Systematic Literature Review of Tasks, Evaluation, and Challenges

投稿日: 2024年5月27日作成者: jarxiv

要約テキスト生成はこれまで以上にアクセスしやすくなり、これらのシステム、特に大 … 続きを読む →

カテゴリー: A.1, cs.CL | コメントを受け付けていません

EmpathicStories++: A Multimodal Dataset for Empathy towards Personal Experiences

投稿日: 2024年5月27日作成者: jarxiv

要約共感のモデル化は、人間の相互作用の対人的および経験的な側面に根ざした複雑な … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Optimizing Large Language Models for OpenAPI Code Completion

投稿日: 2024年5月27日作成者: jarxiv

要約大規模言語モデル (LLM) の最近の進歩と、コード生成タスクでの LLM … 続きを読む →

カテゴリー: 68T05, 68T07, 68T50, cs.CL, cs.LG, cs.SE | コメントを受け付けていません

月別アーカイブ: 2024年5月

Sparse Matrix in Large Language Model Fine-tuning

MeteoRA: Multiple-tasks Embedded LoRA for Large Language Models

JsonTuning: Towards Generalizable, Robust, and Controllable Instruction Tuning

Certifiably Robust RAG against Retrieval Corruption

StrategyLLM: Large Language Models as Strategy Generators, Executors, Optimizers, and Evaluators for Problem Solving

Synergizing In-context Learning with Hints for End-to-end Task-oriented Dialog Systems

Profiling checkpointing schedules in adjoint ST-AD

Text Generation: A Systematic Literature Review of Tasks, Evaluation, and Challenges

EmpathicStories++: A Multimodal Dataset for Empathy towards Personal Experiences

Optimizing Large Language Models for OpenAPI Code Completion

最近の投稿

最近のコメント

アーカイブ

カテゴリー