月別アーカイブ: 2024年5月

Sparse Matrix in Large Language Model Fine-tuning

要約 LoRA とそのバリアントは、過剰な計算コストを回避できるため、パラメータ … 続きを読む

カテゴリー: cs.CL | Sparse Matrix in Large Language Model Fine-tuning はコメントを受け付けていません

MeteoRA: Multiple-tasks Embedded LoRA for Large Language Models

要約 事前トレーニング + 微調整パラダイムは、さまざまなダウンストリーム アプ … 続きを読む

カテゴリー: cs.AI, cs.CL, I.2.7 | MeteoRA: Multiple-tasks Embedded LoRA for Large Language Models はコメントを受け付けていません

JsonTuning: Towards Generalizable, Robust, and Controllable Instruction Tuning

要約 命令チューニングは、大規模言語モデル (LLM) のパフォーマンスを最適化 … 続きを読む

カテゴリー: cs.CL | JsonTuning: Towards Generalizable, Robust, and Controllable Instruction Tuning はコメントを受け付けていません

Certifiably Robust RAG against Retrieval Corruption

要約 検索拡張生成 (RAG) は、検索破損攻撃に対して脆弱であることがわかって … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | Certifiably Robust RAG against Retrieval Corruption はコメントを受け付けていません

StrategyLLM: Large Language Models as Strategy Generators, Executors, Optimizers, and Evaluators for Problem Solving

要約 既存のプロンプト手法のほとんどは、他のインスタンスには適用できないインスタ … 続きを読む

カテゴリー: cs.CL | StrategyLLM: Large Language Models as Strategy Generators, Executors, Optimizers, and Evaluators for Problem Solving はコメントを受け付けていません

Synergizing In-context Learning with Hints for End-to-end Task-oriented Dialog Systems

要約 少数ショット (コンテキスト内) 学習を使用して構築された大規模言語モデル … 続きを読む

カテゴリー: cs.CL | Synergizing In-context Learning with Hints for End-to-end Task-oriented Dialog Systems はコメントを受け付けていません

Profiling checkpointing schedules in adjoint ST-AD

要約 チェックポイントは、随伴アルゴリズム微分におけるデータ フロー逆転の基礎で … 続きを読む

カテゴリー: cs.CL | Profiling checkpointing schedules in adjoint ST-AD はコメントを受け付けていません

Text Generation: A Systematic Literature Review of Tasks, Evaluation, and Challenges

要約 テキスト生成はこれまで以上にアクセスしやすくなり、これらのシステム、特に大 … 続きを読む

カテゴリー: A.1, cs.CL | Text Generation: A Systematic Literature Review of Tasks, Evaluation, and Challenges はコメントを受け付けていません

EmpathicStories++: A Multimodal Dataset for Empathy towards Personal Experiences

要約 共感のモデル化は、人間の相互作用の対人的および経験的な側面に根ざした複雑な … 続きを読む

カテゴリー: cs.CL | EmpathicStories++: A Multimodal Dataset for Empathy towards Personal Experiences はコメントを受け付けていません

Optimizing Large Language Models for OpenAPI Code Completion

要約 大規模言語モデル (LLM) の最近の進歩と、コード生成タスクでの LLM … 続きを読む

カテゴリー: 68T05, 68T07, 68T50, cs.CL, cs.LG, cs.SE | Optimizing Large Language Models for OpenAPI Code Completion はコメントを受け付けていません