月別アーカイブ: 2024年4月

Dynamic Cross Attention for Audio-Visual Person Verification

要約 個人または身元の検証は、主に顔や音声などの個別のモダリティを使用して研究さ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | Dynamic Cross Attention for Audio-Visual Person Verification はコメントを受け付けていません

BCFPL: Binary classification ConvNet based Fast Parking space recognition with Low resolution image

要約 自動車は人類の経済活動、特に大都市において重要な役割を果たしています。 こ … 続きを読む

カテゴリー: cs.AI, cs.CV | BCFPL: Binary classification ConvNet based Fast Parking space recognition with Low resolution image はコメントを受け付けていません

Generalizable Neural Human Renderer

要約 アニメート可能な人間のレンダリングにおける最近の進歩は目覚ましい成果を上げ … 続きを読む

カテゴリー: cs.CV | Generalizable Neural Human Renderer はコメントを受け付けていません

Multilevel Geometric Optimization for Regularised Constrained Linear Inverse Problems

要約 ボックス制約をスムーズに組み込む幾何学的マルチレベル最適化アプローチを紹介 … 続きを読む

カテゴリー: 49J40, 49M37, 65K10, 68U10, 74P20, 90C06, cs.CV, math.DG, math.OC | Multilevel Geometric Optimization for Regularised Constrained Linear Inverse Problems はコメントを受け付けていません

YOLOOC: YOLO-based Open-Class Incremental Object Detection with Novel Class Discovery

要約 オープンワールド物体検出 (OWOD) は実際に使用されているため、最近大 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | YOLOOC: YOLO-based Open-Class Incremental Object Detection with Novel Class Discovery はコメントを受け付けていません

SPINEPS — Automatic Whole Spine Segmentation of T2-weighted MR images using a Two-Phase Approach to Multi-class Semantic and Instance Segmentation

要約 目的。 全身 T2w MRI における 14 の脊椎構造 (10 個の椎骨 … 続きを読む

カテゴリー: cs.CV, eess.IV | SPINEPS — Automatic Whole Spine Segmentation of T2-weighted MR images using a Two-Phase Approach to Multi-class Semantic and Instance Segmentation はコメントを受け付けていません

Detecting and Mitigating Hallucination in Large Vision Language Models via Fine-Grained AI Feedback

要約 急速に開発されているラージ ビジョン言語モデル (LVLM) は、さまざま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Detecting and Mitigating Hallucination in Large Vision Language Models via Fine-Grained AI Feedback はコメントを受け付けていません

MultiBooth: Towards Generating All Your Concepts in an Image from Text

要約 この文書では、テキストから画像を生成する際のマルチコンセプトのカスタマイズ … 続きを読む

カテゴリー: cs.CV | MultiBooth: Towards Generating All Your Concepts in an Image from Text はコメントを受け付けていません

Robustness and Visual Explanation for Black Box Image, Video, and ECG Signal Classification with Reinforcement Learning

要約 ECG 信号分析 (1D)、画像分類 (2D)、ビデオ分類 (3D) に及 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV, cs.LG, cs.MA | Robustness and Visual Explanation for Black Box Image, Video, and ECG Signal Classification with Reinforcement Learning はコメントを受け付けていません

UrbanCross: Enhancing Satellite Image-Text Retrieval with Cross-Domain Adaptation

要約 都市化の課題は、都市アプリケーション向けの地理的セマンティクスが強化された … 続きを読む

カテゴリー: cs.AI, cs.CV | UrbanCross: Enhancing Satellite Image-Text Retrieval with Cross-Domain Adaptation はコメントを受け付けていません