月別アーカイブ: 2024年6月

The Influencer Next Door: How Misinformation Creators Use GenAI

投稿日: 2024年6月10日作成者: jarxiv

要約生成 AI (GenAI) の進歩により、人間が生成したコンテンツから A … 続きを読む →

カテゴリー: cs.AI, cs.HC | コメントを受け付けていません

I2EDL: Interactive Instruction Error Detection and Localization

投稿日: 2024年6月10日作成者: jarxiv

要約継続的環境におけるビジョンと言語のナビゲーション (VLN-CE) タスク … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.RO | コメントを受け付けていません

Multi-Head RAG: Solving Multi-Aspect Problems with LLMs

投稿日: 2024年6月10日作成者: jarxiv

要約検索拡張生成 (RAG) は、LLM コンテキストへのドキュメントの検索を … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.IR | コメントを受け付けていません

Robust Reward Design for Markov Decision Processes

投稿日: 2024年6月10日作成者: jarxiv

要約報酬設計の問題では、リーダーとフォロワーの間の相互作用を調べます。リーダー … 続きを読む →

カテゴリー: cs.AI, cs.GT, math.OC | コメントを受け付けていません

Deep Discriminative to Kernel Density Graph for In- and Out-of-distribution Calibrated Inference

投稿日: 2024年6月10日作成者: jarxiv

要約ランダムフォレストやディープニューラルネットワークなどの深層識別アプ … 続きを読む →

カテゴリー: cs.AI, cs.DS, cs.LG, q-bio.NC, stat.ML | コメントを受け付けていません

NeuralThink: Learning Algorithms For Consistent and Efficient Extrapolation Across General Tasks

投稿日: 2024年6月10日作成者: jarxiv

要約私たちは、効率的かつ一貫して外挿できる、つまり（観測サイズの観点から）小さ … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Towards a theory of out-of-distribution learning

投稿日: 2024年6月10日作成者: jarxiv

要約学習は、学習エージェントが経験やデータを公開することでパフォーマンスを向上 … 続きを読む →

カテゴリー: cs.AI, cs.LG, stat.ML | コメントを受け付けていません

SafeDecoding: Defending against Jailbreak Attacks via Safety-Aware Decoding

投稿日: 2024年6月10日作成者: jarxiv

要約大規模言語モデル (LLM) がコード生成やチャットボット支援などの実世界 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR | コメントを受け付けていません

Self-Improving Robust Preference Optimization

投稿日: 2024年6月10日作成者: jarxiv

要約 PPO や DPO などのオンラインとオフラインの両方の RLHF 手法は … 続きを読む →

カテゴリー: cs.AI, cs.LG, stat.ML | コメントを受け付けていません

ChemReasoner: Heuristic Search over a Large Language Model’s Knowledge Space using Quantum-Chemical Feedback

投稿日: 2024年6月10日作成者: jarxiv

要約新しい触媒の発見は、持続可能な未来に移行するための、より効率的な新しい化学 … 続きを読む →

カテゴリー: cs.AI, cs.CE, cs.LG, physics.chem-ph | コメントを受け付けていません

月別アーカイブ: 2024年6月

The Influencer Next Door: How Misinformation Creators Use GenAI

I2EDL: Interactive Instruction Error Detection and Localization

Multi-Head RAG: Solving Multi-Aspect Problems with LLMs

Robust Reward Design for Markov Decision Processes

Deep Discriminative to Kernel Density Graph for In- and Out-of-distribution Calibrated Inference

NeuralThink: Learning Algorithms For Consistent and Efficient Extrapolation Across General Tasks

Towards a theory of out-of-distribution learning

SafeDecoding: Defending against Jailbreak Attacks via Safety-Aware Decoding

Self-Improving Robust Preference Optimization

ChemReasoner: Heuristic Search over a Large Language Model’s Knowledge Space using Quantum-Chemical Feedback

最近の投稿

最近のコメント

アーカイブ

カテゴリー