-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
BHViT: Binarized Hybrid Vision Transformer
要約 モデルのバイナリゼーションは、畳み込みニューラルネットワーク(CNN)のリ … 続きを読む
カテゴリー: cs.CV
BHViT: Binarized Hybrid Vision Transformer はコメントを受け付けていません
LION-FS: Fast & Slow Video-Language Thinker as Online Video Assistant
要約 一人称ビデオアシスタントは、オンラインビデオの対話を通じて私たちの日常生活 … 続きを読む
カテゴリー: cs.CV
LION-FS: Fast & Slow Video-Language Thinker as Online Video Assistant はコメントを受け付けていません
DongbaMIE: A Multimodal Information Extraction Dataset for Evaluating Semantic Understanding of Dongba Pictograms
要約 Dongbaの絵文字は、世界でまだ使用されている唯一の絵文字です。 それら … 続きを読む
カテゴリー: cs.CV
DongbaMIE: A Multimodal Information Extraction Dataset for Evaluating Semantic Understanding of Dongba Pictograms はコメントを受け付けていません
Towards Visual Discrimination and Reasoning of Real-World Physical Dynamics: Physics-Grounded Anomaly Detection
要約 人間は、オブジェクトが条件付けられた物理的知識に基づいて知覚、相互作用、お … 続きを読む
Reasoning to Attend: Try to Understand How Token Works
要約 現在の大規模なマルチモーダルモデル(LMMS)は、視覚言語モデル(LLAV … 続きを読む
カテゴリー: cs.CV
Reasoning to Attend: Try to Understand How Token Works は コメントを受け付けていません
CarPlanner: Consistent Auto-regressive Trajectory Planning for Large-scale Reinforcement Learning in Autonomous Driving
要約 軌道計画は、自律的な運転に不可欠であり、複雑な環境での安全で効率的なナビゲ … 続きを読む
Floorplan-SLAM: A Real-Time, High-Accuracy, and Long-Term Multi-Session Point-Plane SLAM for Efficient Floorplan Reconstruction
要約 フロアプランの再構築は、信頼できる屋内ロボットナビゲーションと高レベルのシ … 続きを読む
Trajectory Prediction for Autonomous Driving: Progress, Limitations, and Future Directions
要約 自動運転車が最新の交通システムに大規模に統合される可能性が成長し続けるため … 続きを読む
LAPTOP-Diff: Layer Pruning and Normalized Distillation for Compressing Diffusion Models
要約 AIGCの時代には、拡散モデルの低予算またはデバイス上のアプリケーションの … 続きを読む
カテゴリー: cs.CV
LAPTOP-Diff: Layer Pruning and Normalized Distillation for Compressing Diffusion Models はコメントを受け付けていません
Find First, Track Next: Decoupling Identification and Propagation in Referring Video Object Segmentation
要約 参照ビデオオブジェクトセグメンテーションは、自然言語プロンプトを使用してビ … 続きを読む
カテゴリー: cs.CV
Find First, Track Next: Decoupling Identification and Propagation in Referring Video Object Segmentation はコメントを受け付けていません