-
最近の投稿
- Versatile Demonstration Interface: Toward More Flexible Robot Demonstration Collection
- Design Space Exploration of Embedded SoC Architectures for Real-Time Optimal Control
- SoftSnap: Rapid Prototyping of Untethered Soft Robots Using Snap-Together Modules
- Sparse Diffusion Policy: A Sparse, Reusable, and Flexible Policy for Robot Learning
- ODTFormer: Efficient Obstacle Detection and Tracking with Stereo Cameras Based on Transformer
-
最近のコメント
表示できるコメントはありません。 cs.AI (28672) cs.CL (21670) cs.CR (2234) cs.CV (35265) cs.LG (33441) cs.RO (16570) cs.SY (2550) eess.IV (4299) eess.SY (2544) stat.ML (4481)
月別アーカイブ: 2024年6月
The Influencer Next Door: How Misinformation Creators Use GenAI
要約 生成 AI (GenAI) の進歩により、人間が生成したコンテンツから A … 続きを読む
I2EDL: Interactive Instruction Error Detection and Localization
要約 継続的環境におけるビジョンと言語のナビゲーション (VLN-CE) タスク … 続きを読む
Multi-Head RAG: Solving Multi-Aspect Problems with LLMs
要約 検索拡張生成 (RAG) は、LLM コンテキストへのドキュメントの検索を … 続きを読む
Robust Reward Design for Markov Decision Processes
要約 報酬設計の問題では、リーダーとフォロワーの間の相互作用を調べます。リーダー … 続きを読む
Deep Discriminative to Kernel Density Graph for In- and Out-of-distribution Calibrated Inference
要約 ランダム フォレストやディープ ニューラル ネットワークなどの深層識別アプ … 続きを読む
NeuralThink: Learning Algorithms For Consistent and Efficient Extrapolation Across General Tasks
要約 私たちは、効率的かつ一貫して外挿できる、つまり(観測サイズの観点から)小さ … 続きを読む
Towards a theory of out-of-distribution learning
要約 学習は、学習エージェントが経験やデータを公開することでパフォーマンスを向上 … 続きを読む
SafeDecoding: Defending against Jailbreak Attacks via Safety-Aware Decoding
要約 大規模言語モデル (LLM) がコード生成やチャットボット支援などの実世界 … 続きを読む
Self-Improving Robust Preference Optimization
要約 PPO や DPO などのオンラインとオフラインの両方の RLHF 手法は … 続きを読む
ChemReasoner: Heuristic Search over a Large Language Model’s Knowledge Space using Quantum-Chemical Feedback
要約 新しい触媒の発見は、持続可能な未来に移行するための、より効率的な新しい化学 … 続きを読む
カテゴリー: cs.AI, cs.CE, cs.LG, physics.chem-ph
ChemReasoner: Heuristic Search over a Large Language Model’s Knowledge Space using Quantum-Chemical Feedback はコメントを受け付けていません