-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Reasoning-Enhanced Object-Centric Learning for Videos
要約 オブジェクト中心学習は、複雑な視覚的シーンをより管理しやすいオブジェクト表 … 続きを読む
Self-Supervised Backbone Framework for Diverse Agricultural Vision Tasks
要約 農業におけるコンピューター ビジョンは、農業をデータ駆動型で正確な持続可能 … 続きを読む
Spectral Motion Alignment for Video Motion Transfer using Diffusion Models
要約 拡散モデルの進化は、ビデオの生成と理解に大きな影響を与えました。 特に、テ … 続きを読む
VisionGPT-3D: A Generalized Multimodal Agent for Enhanced 3D Vision Understanding
要約 テキストからビジュアルコンポーネントへの進化により、テキストから画像やビデ … 続きを読む
CR3DT: Camera-RADAR Fusion for 3D Detection and Tracking
要約 自動運転車を実現するには、周囲の物体の正確な検出と追跡が不可欠です。 Li … 続きを読む
Point-DETR3D: Leveraging Imagery Data with Spatial Point Prior for Weakly Semi-supervised 3D Object Detection
要約 高精度 3D 検出器をトレーニングするには、7 自由度の大量のラベル付き … 続きを読む
Faster Neighborhood Attention: Reducing the O(n^2) Cost of Self Attention at the Threadblock Level
要約 近隣注目は、各トークンの注目範囲をその最も近い隣接トークンに制限することで … 続きを読む
Fast ODE-based Sampling for Diffusion Models in Around 5 Steps
要約 拡散モデルからのサンプリングは、可能な限り少ない関数評価 (NFE) で正 … 続きを読む
VideoPoet: A Large Language Model for Zero-Shot Video Generation
要約 我々は、多種多様な調整信号から、高品質のビデオと一致するオーディオを合成で … 続きを読む