-
最近の投稿
- Geometric Impedance Control on SE(3) for Robotic Manipulators
- Adaptive Energy Regularization for Autonomous Gait Transition and Energy-Efficient Quadruped Locomotion
- CarPlanner: Consistent Auto-regressive Trajectory Planning for Large-scale Reinforcement Learning in Autonomous Driving
- Affordance-Guided Reinforcement Learning via Visual Prompting
- OpenGV 2.0: Motion prior-assisted calibration and SLAM with vehicle-mounted surround-view systems
-
最近のコメント
表示できるコメントはありません。 cs.AI (34674) cs.CL (26212) cs.CR (2657) cs.CV (40510) cs.LG (39676) cs.RO (20296) cs.SY (3081) eess.IV (4814) eess.SY (3075) stat.ML (5222)
「cs.CV」カテゴリーアーカイブ
REGRACE: A Robust and Efficient Graph-based Re-localization Algorithm using Consistency Evaluation
要約 ループ閉鎖は、特に大規模なナビゲーションのコンテキストで、臭気測定のドリフ … 続きを読む
Unleashing HyDRa: Hybrid Fusion, Depth Consistency and Radar for Unified 3D Perception
要約 自律運転のための低コストの視覚中心の3D認識システムは、近年大きな進歩を遂 … 続きを読む
StdGEN: Semantic-Decomposed 3D Character Generation from Single Images
要約 STDGenは、単一の画像からセマンティックに分解された高品質の3D文字を … 続きを読む
CLIP is Strong Enough to Fight Back: Test-time Counterattacks towards Zero-shot Adversarial Robustness of CLIP
要約 画像テキストマッチングタスクでの一般的な使用は、ゼロショットの方法で使用さ … 続きを読む
Reasoning to Attend: Try to Understand How Token Works
要約 現在の大規模なマルチモーダルモデル(LMMS)は、視覚言語モデル(LLAV … 続きを読む
More than Memes: A Multimodal Topic Modeling Approach to Conspiracy Theories on Telegram
要約 ソーシャルメディアでの(オーディオ)視覚データの増加する有病率に対処し、こ … 続きを読む
4D Radar Ground Truth Augmentation with LiDAR-to-4D Radar Data Synthesis
要約 グラウンドトゥルースの増強(GT-8月)は、グラウンドトゥルース境界ボック … 続きを読む
An Adaptive Underwater Image Enhancement Framework via Multi-Domain Fusion and Color Compensation
要約 水中光学イメージングは、光吸収、散乱、色の歪みにより、視界と正確な画像 … 続きを読む
DongbaMIE: A Multimodal Information Extraction Dataset for Evaluating Semantic Understanding of Dongba Pictograms
要約 Dongbaの絵文字は、世界でまだ使用されている唯一の絵文字です。 それら … 続きを読む
DoraCycle: Domain-Oriented Adaptation of Unified Generative Model in Multimodal Cycles
要約 生成モデルを特定のドメインに適応させることは、特殊な要件を満たすための効果 … 続きを読む