月別アーカイブ: 2024年6月

The Influencer Next Door: How Misinformation Creators Use GenAI

要約 生成 AI (GenAI) の進歩により、人間が生成したコンテンツから A … 続きを読む

カテゴリー: cs.AI, cs.HC | The Influencer Next Door: How Misinformation Creators Use GenAI はコメントを受け付けていません

I2EDL: Interactive Instruction Error Detection and Localization

要約 継続的環境におけるビジョンと言語のナビゲーション (VLN-CE) タスク … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.RO | I2EDL: Interactive Instruction Error Detection and Localization はコメントを受け付けていません

Multi-Head RAG: Solving Multi-Aspect Problems with LLMs

要約 検索拡張生成 (RAG) は、LLM コンテキストへのドキュメントの検索を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | Multi-Head RAG: Solving Multi-Aspect Problems with LLMs はコメントを受け付けていません

Robust Reward Design for Markov Decision Processes

要約 報酬設計の問題では、リーダーとフォロワーの間の相互作用を調べます。リーダー … 続きを読む

カテゴリー: cs.AI, cs.GT, math.OC | Robust Reward Design for Markov Decision Processes はコメントを受け付けていません

Deep Discriminative to Kernel Density Graph for In- and Out-of-distribution Calibrated Inference

要約 ランダム フォレストやディープ ニューラル ネットワークなどの深層識別アプ … 続きを読む

カテゴリー: cs.AI, cs.DS, cs.LG, q-bio.NC, stat.ML | Deep Discriminative to Kernel Density Graph for In- and Out-of-distribution Calibrated Inference はコメントを受け付けていません

NeuralThink: Learning Algorithms For Consistent and Efficient Extrapolation Across General Tasks

要約 私たちは、効率的かつ一貫して外挿できる、つまり(観測サイズの観点から)小さ … 続きを読む

カテゴリー: cs.AI, cs.LG | NeuralThink: Learning Algorithms For Consistent and Efficient Extrapolation Across General Tasks はコメントを受け付けていません

Towards a theory of out-of-distribution learning

要約 学習は、学習エージェントが経験やデータを公開することでパフォーマンスを向上 … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Towards a theory of out-of-distribution learning はコメントを受け付けていません

SafeDecoding: Defending against Jailbreak Attacks via Safety-Aware Decoding

要約 大規模言語モデル (LLM) がコード生成やチャットボット支援などの実世界 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR | SafeDecoding: Defending against Jailbreak Attacks via Safety-Aware Decoding はコメントを受け付けていません

Self-Improving Robust Preference Optimization

要約 PPO や DPO などのオンラインとオフラインの両方の RLHF 手法は … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Self-Improving Robust Preference Optimization はコメントを受け付けていません

ChemReasoner: Heuristic Search over a Large Language Model’s Knowledge Space using Quantum-Chemical Feedback

要約 新しい触媒の発見は、持続可能な未来に移行するための、より効率的な新しい化学 … 続きを読む

カテゴリー: cs.AI, cs.CE, cs.LG, physics.chem-ph | ChemReasoner: Heuristic Search over a Large Language Model’s Knowledge Space using Quantum-Chemical Feedback はコメントを受け付けていません