-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
AceReason-Nemotron: Advancing Math and Code Reasoning through Reinforcement Learning
要約 推論のための大規模な強化学習(RL)の最近の進歩にもかかわらず、高性能の推 … 続きを読む
Exploring Diffusion Transformer Designs via Grafting
要約 モデルアーキテクチャの設計には、オペレーター(注意、畳み込みなど)や構成( … 続きを読む
Rectified Point Flow: Generic Point Cloud Pose Estimation
要約 ペアワイズポイントクラウド登録とマルチパート形状アセンブリを単一の条件付き … 続きを読む
Direct Numerical Layout Generation for 3D Indoor Scene Synthesis via Spatial Reasoning
要約 具体化されたAIおよびデジタルコンテンツの作成には、現実的な3D屋内シーン … 続きを読む
Refer to Anything with Vision-Language Prompts
要約 最近の画像セグメンテーションモデルは、画像を視覚エンティティの高品質のマス … 続きを読む
macOSWorld: A Multilingual Interactive Benchmark for GUI Agents
要約 グラフィカルユーザーインターフェイス(GUI)エージェントは、コンピュータ … 続きを読む
カテゴリー: cs.AI
macOSWorld: A Multilingual Interactive Benchmark for GUI Agents はコメントを受け付けていません
UniWorld-V1: High-Resolution Semantic Encoders for Unified Visual Understanding and Generation
要約 既存の統一モデルは、ビジョン言語の理解とテキストからイメージの生成において … 続きを読む
Confidence-Guided Human-AI Collaboration: Reinforcement Learning with Distributional Proxy Value Propagation for Autonomous Driving
要約 自律運転は、モビリティ、交通安全、交通効率の重要な進歩を約束しますが、補強 … 続きを読む
Biased by Design: Leveraging Inherent AI Biases to Enhance Critical Thinking of News Readers
要約 このペーパーでは、大規模な言語モデル(LLMS)を使用したプロパガンダ検出 … 続きを読む
Grounded Vision-Language Interpreter for Integrated Task and Motion Planning
要約 ビジョン言語モデル(VLM)の最近の進歩により、言語誘導ロボットプランナー … 続きを読む