-
最近の投稿
- Geometric Impedance Control on SE(3) for Robotic Manipulators
- Adaptive Energy Regularization for Autonomous Gait Transition and Energy-Efficient Quadruped Locomotion
- CarPlanner: Consistent Auto-regressive Trajectory Planning for Large-scale Reinforcement Learning in Autonomous Driving
- Affordance-Guided Reinforcement Learning via Visual Prompting
- OpenGV 2.0: Motion prior-assisted calibration and SLAM with vehicle-mounted surround-view systems
-
最近のコメント
表示できるコメントはありません。 cs.AI (34674) cs.CL (26212) cs.CR (2657) cs.CV (40510) cs.LG (39676) cs.RO (20296) cs.SY (3081) eess.IV (4814) eess.SY (3075) stat.ML (5222)
「cs.CV」カテゴリーアーカイブ
Exploring the Effectiveness of Object-Centric Representations in Visual Question Answering: Comparative Insights with Foundation Models
要約 離散オブジェクトの構成として視覚シーンをモデル化するオブジェクト中心(OC … 続きを読む
Language-Informed Hyperspectral Image Synthesis for Imbalanced-Small Sample Classification via Semi-Supervised Conditional Diffusion Model
要約 データ増強は、ハイパースペクトル画像分類(HSIC)の不均衡なスマルサンプ … 続きを読む
Foundation Models — A Panacea for Artificial Intelligence in Pathology?
要約 病理学における人工知能(AI)の役割は、診断を支援することから、全体のスラ … 続きを読む
Adaptive Keyframe Sampling for Long Video Understanding
要約 マルチモーダル大手言語モデル(MLLM)は、視覚入力をコンテキストとして大 … 続きを読む
Back to the Future Cyclopean Stereo: a human perception approach unifying deep and geometric constraints
要約 深さの不連続性と閉塞を組み込んだシクロピアンアイモデルで見られるように、分 … 続きを読む
Efficient and Context-Aware Label Propagation for Zero-/Few-Shot Training-Free Adaptation of Vision-Language Model
要約 ビジョン言語モデル(VLM)は、さまざまな下流タスクに取り組むために、大規 … 続きを読む
MIGE: A Unified Framework for Multimodal Instruction-Based Image Generation and Editing
要約 拡散ベースの画像生成の大幅な進歩にもかかわらず、被験者主導の生成と命令ベー … 続きを読む
AutoComb: Automated Comb Sign Detector for 3D CTE Scans
要約 コームサインは、複数の胃腸疾患を検出するための重要なイメージングバイオマー … 続きを読む
DELTA: Dense Efficient Long-range 3D Tracking for any video
要約 特に長いシーケンスにわたるピクセルレベルの精度を目指している場合、単眼ビデ … 続きを読む
Unsupervised Parameter Efficient Source-free Post-pretraining
要約 NLPでの成功に続いて、最高のビジョンモデルは現在、10億パラメーターの範 … 続きを読む