cs.CV」カテゴリーアーカイブ

REGRACE: A Robust and Efficient Graph-based Re-localization Algorithm using Consistency Evaluation

要約 ループ閉鎖は、特に大規模なナビゲーションのコンテキストで、臭気測定のドリフ … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

Unleashing HyDRa: Hybrid Fusion, Depth Consistency and Radar for Unified 3D Perception

要約 自律運転のための低コストの視覚中心の3D認識システムは、近年大きな進歩を遂 … 続きを読む

カテゴリー: cs.CV | コメントする

StdGEN: Semantic-Decomposed 3D Character Generation from Single Images

要約 STDGenは、単一の画像からセマンティックに分解された高品質の3D文字を … 続きを読む

カテゴリー: cs.CV | コメントする

CLIP is Strong Enough to Fight Back: Test-time Counterattacks towards Zero-shot Adversarial Robustness of CLIP

要約 画像テキストマッチングタスクでの一般的な使用は、ゼロショットの方法で使用さ … 続きを読む

カテゴリー: cs.CV | コメントする

Reasoning to Attend: Try to Understand How Token Works

要約 現在の大規模なマルチモーダルモデル(LMMS)は、視覚言語モデル(LLAV … 続きを読む

カテゴリー: cs.CV | コメントする

More than Memes: A Multimodal Topic Modeling Approach to Conspiracy Theories on Telegram

要約 ソーシャルメディアでの(オーディオ)視覚データの増加する有病率に対処し、こ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM, cs.SI | コメントする

4D Radar Ground Truth Augmentation with LiDAR-to-4D Radar Data Synthesis

要約 グラウンドトゥルースの増強(GT-8月)は、グラウンドトゥルース境界ボック … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする

An Adaptive Underwater Image Enhancement Framework via Multi-Domain Fusion and Color Compensation

要約 水中光学イメージングは​​、光吸収、散乱、色の歪みにより、視界と正確な画像 … 続きを読む

カテゴリー: cs.CV | コメントする

DongbaMIE: A Multimodal Information Extraction Dataset for Evaluating Semantic Understanding of Dongba Pictograms

要約 Dongbaの絵文字は、世界でまだ使用されている唯一の絵文字です。 それら … 続きを読む

カテゴリー: cs.CV | コメントする

DoraCycle: Domain-Oriented Adaptation of Unified Generative Model in Multimodal Cycles

要約 生成モデルを特定のドメインに適応させることは、特殊な要件を満たすための効果 … 続きを読む

カテゴリー: cs.CV | コメントする