cs.CV」カテゴリーアーカイブ

BHViT: Binarized Hybrid Vision Transformer

要約 モデルのバイナリゼーションは、畳み込みニューラルネットワーク(CNN)のリ … 続きを読む

カテゴリー: cs.CV | BHViT: Binarized Hybrid Vision Transformer はコメントを受け付けていません

LION-FS: Fast & Slow Video-Language Thinker as Online Video Assistant

要約 一人称ビデオアシスタントは、オンラインビデオの対話を通じて私たちの日常生活 … 続きを読む

カテゴリー: cs.CV | LION-FS: Fast & Slow Video-Language Thinker as Online Video Assistant はコメントを受け付けていません

DongbaMIE: A Multimodal Information Extraction Dataset for Evaluating Semantic Understanding of Dongba Pictograms

要約 Dongbaの絵文字は、世界でまだ使用されている唯一の絵文字です。 それら … 続きを読む

カテゴリー: cs.CV | DongbaMIE: A Multimodal Information Extraction Dataset for Evaluating Semantic Understanding of Dongba Pictograms はコメントを受け付けていません

Towards Visual Discrimination and Reasoning of Real-World Physical Dynamics: Physics-Grounded Anomaly Detection

要約 人間は、オブジェクトが条件付けられた物理的知識に基づいて知覚、相互作用、お … 続きを読む

カテゴリー: cs.AI, cs.CV | Towards Visual Discrimination and Reasoning of Real-World Physical Dynamics: Physics-Grounded Anomaly Detection はコメントを受け付けていません

Reasoning to Attend: Try to Understand How Token Works

要約 現在の大規模なマルチモーダルモデル(LMMS)は、視覚言語モデル(LLAV … 続きを読む

カテゴリー: cs.CV | Reasoning to Attend: Try to Understand How Token Works はコメントを受け付けていません

CarPlanner: Consistent Auto-regressive Trajectory Planning for Large-scale Reinforcement Learning in Autonomous Driving

要約 軌道計画は、自律的な運転に不可欠であり、複雑な環境での安全で効率的なナビゲ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | CarPlanner: Consistent Auto-regressive Trajectory Planning for Large-scale Reinforcement Learning in Autonomous Driving はコメントを受け付けていません

Floorplan-SLAM: A Real-Time, High-Accuracy, and Long-Term Multi-Session Point-Plane SLAM for Efficient Floorplan Reconstruction

要約 フロアプランの再構築は、信頼できる屋内ロボットナビゲーションと高レベルのシ … 続きを読む

カテゴリー: cs.CV, cs.RO | Floorplan-SLAM: A Real-Time, High-Accuracy, and Long-Term Multi-Session Point-Plane SLAM for Efficient Floorplan Reconstruction はコメントを受け付けていません

Trajectory Prediction for Autonomous Driving: Progress, Limitations, and Future Directions

要約 自動運転車が最新の交通システムに大規模に統合される可能性が成長し続けるため … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Trajectory Prediction for Autonomous Driving: Progress, Limitations, and Future Directions はコメントを受け付けていません

LAPTOP-Diff: Layer Pruning and Normalized Distillation for Compressing Diffusion Models

要約 AIGCの時代には、拡散モデルの低予算またはデバイス上のアプリケーションの … 続きを読む

カテゴリー: cs.CV | LAPTOP-Diff: Layer Pruning and Normalized Distillation for Compressing Diffusion Models はコメントを受け付けていません

Find First, Track Next: Decoupling Identification and Propagation in Referring Video Object Segmentation

要約 参照ビデオオブジェクトセグメンテーションは、自然言語プロンプトを使用してビ … 続きを読む

カテゴリー: cs.CV | Find First, Track Next: Decoupling Identification and Propagation in Referring Video Object Segmentation はコメントを受け付けていません