cs.AI」カテゴリーアーカイブ

Safeguard is a Double-edged Sword: Denial-of-service Attack on Large Language Models

要約 安全性は、オープン展開における大規模言語モデル (LLM) の最大の関心事 … 続きを読む

カテゴリー: cs.AI, cs.CR | Safeguard is a Double-edged Sword: Denial-of-service Attack on Large Language Models はコメントを受け付けていません

Explaining Bayesian Networks in Natural Language using Factor Arguments. Evaluation in the medical domain

要約 この論文では、因子引数の観点からベイジアン ネットワーク推論の自然言語説明 … 続きを読む

カテゴリー: cs.AI, cs.LO | Explaining Bayesian Networks in Natural Language using Factor Arguments. Evaluation in the medical domain はコメントを受け付けていません

Utilitarian Algorithm Configuration for Infinite Parameter Spaces

要約 功利主義的アルゴリズム構成は、特定のアルゴリズムのパラメーター空間を自動的 … 続きを読む

カテゴリー: cs.AI | Utilitarian Algorithm Configuration for Infinite Parameter Spaces はコメントを受け付けていません

Conditional Language Policy: A General Framework for Steerable Multi-Objective Finetuning

要約 報酬ベースの微調整は、言語ポリシーを意図された行動 (創造性や安全性など) … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Conditional Language Policy: A General Framework for Steerable Multi-Objective Finetuning はコメントを受け付けていません

MADial-Bench: Towards Real-world Evaluation of Memory-Augmented Dialogue Generation

要約 長期記憶は、チャットボットや対話システム (DS) が一貫性のある人間のよ … 続きを読む

カテゴリー: cs.AI, cs.CL | MADial-Bench: Towards Real-world Evaluation of Memory-Augmented Dialogue Generation はコメントを受け付けていません

Beyond position: how rotary embeddings shape representations and memory in autoregressive transfomers

要約 Rotary Positional Embeddings (RoPE) は … 続きを読む

カテゴリー: cs.AI, cs.LG | Beyond position: how rotary embeddings shape representations and memory in autoregressive transfomers はコメントを受け付けていません

Physical Reasoning and Object Planning for Household Embodied Agents

要約 この研究では、代替オブジェクトを選択する複雑なタスクに特に重点を置き、堅牢 … 続きを読む

カテゴリー: cs.AI | Physical Reasoning and Object Planning for Household Embodied Agents はコメントを受け付けていません

Correlated Proxies: A New Definition and Improved Mitigation for Reward Hacking

要約 複雑な目標を正確に指定することは難しいため、強化学習ポリシーは多くの場合、 … 続きを読む

カテゴリー: cs.AI, cs.LG | Correlated Proxies: A New Definition and Improved Mitigation for Reward Hacking はコメントを受け付けていません

Training Free Guided Flow Matching with Optimal Control

要約 事前トレーニングされた拡散モデルとフローマッチングモデルを使用した制御され … 続きを読む

カテゴリー: cs.AI, cs.LG | Training Free Guided Flow Matching with Optimal Control はコメントを受け付けていません

Leveraging Skills from Unlabeled Prior Data for Efficient Online Exploration

要約 教師なし事前トレーニングは、多くの教師ありドメインで変革をもたらしました。 … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Leveraging Skills from Unlabeled Prior Data for Efficient Online Exploration はコメントを受け付けていません