月別アーカイブ: 2025年3月

4D Radar Ground Truth Augmentation with LiDAR-to-4D Radar Data Synthesis

投稿日: 2025年3月6日作成者: jarxiv

要約グラウンドトゥルースの増強（GT-8月）は、グラウンドトゥルース境界ボック … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

An Adaptive Underwater Image Enhancement Framework via Multi-Domain Fusion and Color Compensation

投稿日: 2025年3月6日作成者: jarxiv

要約水中光学イメージングは、光吸収、散乱、色の歪みにより、視界と正確な画像 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DongbaMIE: A Multimodal Information Extraction Dataset for Evaluating Semantic Understanding of Dongba Pictograms

投稿日: 2025年3月6日作成者: jarxiv

要約 Dongbaの絵文字は、世界でまだ使用されている唯一の絵文字です。それら … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DoraCycle: Domain-Oriented Adaptation of Unified Generative Model in Multimodal Cycles

投稿日: 2025年3月6日作成者: jarxiv

要約生成モデルを特定のドメインに適応させることは、特殊な要件を満たすための効果 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Improving 6D Object Pose Estimation of metallic Household and Industry Objects

投稿日: 2025年3月6日作成者: jarxiv

要約 6Dオブジェクトのポーズ推定は、金属オブジェクトに適用すると精度が低下する … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

What to align in multimodal contrastive learning?

投稿日: 2025年3月6日作成者: jarxiv

要約人間は多感覚統合を通じて世界を認識し、さまざまなモダリティの情報を混ぜ合わ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

LION-FS: Fast & Slow Video-Language Thinker as Online Video Assistant

投稿日: 2025年3月6日作成者: jarxiv

要約一人称ビデオアシスタントは、オンラインビデオの対話を通じて私たちの日常生活 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

A Generative Approach to High Fidelity 3D Reconstruction from Text Data

投稿日: 2025年3月6日作成者: jarxiv

要約生成的人工知能と高度なコンピュータービジョンテクノロジーの収束は、テキスト … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

DualDiff+: Dual-Branch Diffusion for High-Fidelity Video Generation with Reward Guidance

投稿日: 2025年3月6日作成者: jarxiv

要約正確で忠実な運転シーンの再構築には、包括的なシーン情報を条件付き入力として … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Beyond Matryoshka: Revisiting Sparse Coding for Adaptive Representation

投稿日: 2025年3月6日作成者: jarxiv

要約多くの大規模システムは、検索、検索、生成モデリングなどのタスクを容易にする … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.IR, cs.LG | コメントを受け付けていません

月別アーカイブ: 2025年3月

4D Radar Ground Truth Augmentation with LiDAR-to-4D Radar Data Synthesis

An Adaptive Underwater Image Enhancement Framework via Multi-Domain Fusion and Color Compensation

DongbaMIE: A Multimodal Information Extraction Dataset for Evaluating Semantic Understanding of Dongba Pictograms

DoraCycle: Domain-Oriented Adaptation of Unified Generative Model in Multimodal Cycles

Improving 6D Object Pose Estimation of metallic Household and Industry Objects

What to align in multimodal contrastive learning?

LION-FS: Fast & Slow Video-Language Thinker as Online Video Assistant

A Generative Approach to High Fidelity 3D Reconstruction from Text Data

DualDiff+: Dual-Branch Diffusion for High-Fidelity Video Generation with Reward Guidance

Beyond Matryoshka: Revisiting Sparse Coding for Adaptive Representation

最近の投稿

最近のコメント

アーカイブ

カテゴリー