月別アーカイブ: 2025年3月

4D Radar Ground Truth Augmentation with LiDAR-to-4D Radar Data Synthesis

要約 グラウンドトゥルースの増強(GT-8月)は、グラウンドトゥルース境界ボック … 続きを読む

カテゴリー: cs.CV, eess.IV | 4D Radar Ground Truth Augmentation with LiDAR-to-4D Radar Data Synthesis はコメントを受け付けていません

An Adaptive Underwater Image Enhancement Framework via Multi-Domain Fusion and Color Compensation

要約 水中光学イメージングは​​、光吸収、散乱、色の歪みにより、視界と正確な画像 … 続きを読む

カテゴリー: cs.CV | An Adaptive Underwater Image Enhancement Framework via Multi-Domain Fusion and Color Compensation はコメントを受け付けていません

DongbaMIE: A Multimodal Information Extraction Dataset for Evaluating Semantic Understanding of Dongba Pictograms

要約 Dongbaの絵文字は、世界でまだ使用されている唯一の絵文字です。 それら … 続きを読む

カテゴリー: cs.CV | DongbaMIE: A Multimodal Information Extraction Dataset for Evaluating Semantic Understanding of Dongba Pictograms はコメントを受け付けていません

DoraCycle: Domain-Oriented Adaptation of Unified Generative Model in Multimodal Cycles

要約 生成モデルを特定のドメインに適応させることは、特殊な要件を満たすための効果 … 続きを読む

カテゴリー: cs.CV | DoraCycle: Domain-Oriented Adaptation of Unified Generative Model in Multimodal Cycles はコメントを受け付けていません

Improving 6D Object Pose Estimation of metallic Household and Industry Objects

要約 6Dオブジェクトのポーズ推定は、金属オブジェクトに適用すると精度が低下する … 続きを読む

カテゴリー: cs.AI, cs.CV | Improving 6D Object Pose Estimation of metallic Household and Industry Objects はコメントを受け付けていません

What to align in multimodal contrastive learning?

要約 人間は多感覚統合を通じて世界を認識し、さまざまなモダリティの情報を混ぜ合わ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | What to align in multimodal contrastive learning? はコメントを受け付けていません

LION-FS: Fast & Slow Video-Language Thinker as Online Video Assistant

要約 一人称ビデオアシスタントは、オンラインビデオの対話を通じて私たちの日常生活 … 続きを読む

カテゴリー: cs.CV | LION-FS: Fast & Slow Video-Language Thinker as Online Video Assistant はコメントを受け付けていません

A Generative Approach to High Fidelity 3D Reconstruction from Text Data

要約 生成的人工知能と高度なコンピュータービジョンテクノロジーの収束は、テキスト … 続きを読む

カテゴリー: cs.AI, cs.CV | A Generative Approach to High Fidelity 3D Reconstruction from Text Data はコメントを受け付けていません

DualDiff+: Dual-Branch Diffusion for High-Fidelity Video Generation with Reward Guidance

要約 正確で忠実な運転シーンの再構築には、包括的なシーン情報を条件付き入力として … 続きを読む

カテゴリー: cs.CV | DualDiff+: Dual-Branch Diffusion for High-Fidelity Video Generation with Reward Guidance はコメントを受け付けていません

Beyond Matryoshka: Revisiting Sparse Coding for Adaptive Representation

要約 多くの大規模システムは、検索、検索、生成モデリングなどのタスクを容易にする … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, cs.LG | Beyond Matryoshka: Revisiting Sparse Coding for Adaptive Representation はコメントを受け付けていません