-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
SurgBox: Agent-Driven Operating Room Sandbox with Surgery Copilot
要約 外科的介入、特に神経内科における外科的介入は、外科チームに多大な認知的負担 … 続きを読む
Archaeoscape: Bringing Aerial Laser Scanning Archaeology to the Deep Learning Era
要約 航空機レーザー スキャン (ALS) テクノロジーは、密集した植生の下に隠 … 続きを読む
CompCap: Improving Multimodal Large Language Models with Composite Captions
要約 マルチモーダル大規模言語モデル (MLLM) は合成画像をどの程度理解でき … 続きを読む
From classical techniques to convolution-based models: A review of object detection algorithms
要約 オブジェクト検出は、コンピューター ビジョンと画像理解における基本的なタス … 続きを読む
TeamCraft: A Benchmark for Multi-Modal Multi-Agent Systems in Minecraft
要約 コラボレーションは社会の基礎です。 現実の世界では、人間のチームメイトは多 … 続きを読む
Extrapolated Urban View Synthesis Benchmark
要約 フォトリアリスティックなシミュレーターは、ビジョン中心の自動運転車 (AV … 続きを読む
MotionFlow: Attention-Driven Motion Transfer in Video Diffusion Models
要約 Text-to-Video モデルは、多様で魅力的なビデオ コンテンツを生 … 続きを読む
Stag-1: Towards Realistic 4D Driving Simulation with Video Generation Model
要約 現実的な自動運転シミュレーターの開発には4D運転シミュレーションが不可欠で … 続きを読む
Artificial intelligence and the internal processes of creativity
要約 創造的な成果を生成できる人工知能 (AI) システムは、創造性に対する私た … 続きを読む
EmbodiedOcc: Embodied 3D Occupancy Prediction for Vision-based Online Scene Understanding
要約 3D 占有予測は周囲のシーンの包括的な説明を提供し、3D 認識にとって不可 … 続きを読む