cs.CV」カテゴリーアーカイブ

Human-in-the-loop Reasoning For Traffic Sign Detection: Collaborative Approach Yolo With Video-llava

要約 トラフィックサイン認識(TSR)検出は、自律車両の重要なコンポーネントです … 続きを読む

カテゴリー: cs.CV | コメントする

On the Utility of Equivariance and Symmetry Breaking in Deep Learning Architectures on Point Clouds

要約 このホワイトペーパーでは、さまざまな幾何学的複雑さのさまざまなタスクにわた … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | コメントする

REGRACE: A Robust and Efficient Graph-based Re-localization Algorithm using Consistency Evaluation

要約 ループ閉鎖は、特に大規模なナビゲーションのコンテキストで、臭気測定のドリフ … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

Unleashing HyDRa: Hybrid Fusion, Depth Consistency and Radar for Unified 3D Perception

要約 自律運転のための低コストの視覚中心の3D認識システムは、近年大きな進歩を遂 … 続きを読む

カテゴリー: cs.CV | コメントする

StdGEN: Semantic-Decomposed 3D Character Generation from Single Images

要約 STDGenは、単一の画像からセマンティックに分解された高品質の3D文字を … 続きを読む

カテゴリー: cs.CV | コメントする

CLIP is Strong Enough to Fight Back: Test-time Counterattacks towards Zero-shot Adversarial Robustness of CLIP

要約 画像テキストマッチングタスクでの一般的な使用は、ゼロショットの方法で使用さ … 続きを読む

カテゴリー: cs.CV | コメントする

Reasoning to Attend: Try to Understand How Token Works

要約 現在の大規模なマルチモーダルモデル(LMMS)は、視覚言語モデル(LLAV … 続きを読む

カテゴリー: cs.CV | コメントする

More than Memes: A Multimodal Topic Modeling Approach to Conspiracy Theories on Telegram

要約 ソーシャルメディアでの(オーディオ)視覚データの増加する有病率に対処し、こ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM, cs.SI | コメントする

4D Radar Ground Truth Augmentation with LiDAR-to-4D Radar Data Synthesis

要約 グラウンドトゥルースの増強(GT-8月)は、グラウンドトゥルース境界ボック … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする

An Adaptive Underwater Image Enhancement Framework via Multi-Domain Fusion and Color Compensation

要約 水中光学イメージングは​​、光吸収、散乱、色の歪みにより、視界と正確な画像 … 続きを読む

カテゴリー: cs.CV | コメントする