投稿者「jarxiv」のアーカイブ

DenSe-AdViT: A novel Vision Transformer for Dense SAR Object Detection

要約 視覚変圧器(VIT)は、グローバルな特徴を抽出する特別な能力により、合成開 … 続きを読む

カテゴリー: cs.CV | コメントする

AnomalyControl: Learning Cross-modal Semantic Features for Controllable Anomaly Synthesis

要約 異常合成は、異常検査を進めるための異常なデータを増強するための重要なアプロ … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

The Mirage of Performance Gains: Why Contrastive Decoding Fails to Address Multimodal Hallucination

要約 対照的なデコード戦略は、マルチモーダルの大手言語モデル(MLLM)の幻覚を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | コメントする

IReNe: Instant Recoloring of Neural Radiance Fields

要約 NERFの進歩により、3Dシーンの再構築と新しいビューの合成が可能になりま … 続きを読む

カテゴリー: cs.CV | コメントする

LeOCLR: Leveraging Original Images for Contrastive Learning of Visual Representations

要約 対照的なインスタンス識別方法は、画像分類やオブ​​ジェクト検出などの下流タ … 続きを読む

カテゴリー: cs.CV | コメントする

DialogGen: Multi-modal Interactive Dialogue System for Multi-turn Text-to-Image Generation

要約 テキストからイメージ(T2I)生成モデルは、近年大幅に進歩しています。 た … 続きを読む

カテゴリー: cs.CV | コメントする

Efficient Parameter Adaptation for Multi-Modal Medical Image Segmentation and Prognosis

要約 がんの検出と予後は、医療イメージング、特にCTとPETスキャンに大きく依存 … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Lightweight LiDAR-Camera 3D Dynamic Object Detection and Multi-Class Trajectory Prediction

要約 多くの場合、サービスモバイルロボットは、タスクを実行しながら動的なオブジェ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | コメントする

Enhancing Pothole Detection and Characterization: Integrated Segmentation and Depth Estimation in Road Anomaly Systems

要約 道路の異常検出は、道路のメンテナンスとドライバーと車両の両方の安全性を高め … 続きを読む

カテゴリー: cs.CV, cs.SY, eess.SY | コメントする

BRIGHT: A globally distributed multimodal building damage assessment dataset with very-high-resolution for all-weather disaster response

要約 災害イベントは世界中で発生し、人間の生活と財産に大きな損害を与えます。 地 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV, eess.SP | コメントする