月別アーカイブ: 2024年3月

Arc2Face: A Foundation Model of Human Faces

要約 この論文では、アイデンティティ条件付きの顔基礎モデルである Arc2Fac … 続きを読む

カテゴリー: cs.CV | Arc2Face: A Foundation Model of Human Faces はコメントを受け付けていません

Diffusion-Based Environment-Aware Trajectory Prediction

要約 交通参加者の将来の軌跡を予測する能力は、自動運転車の安全かつ効率的な運用に … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Diffusion-Based Environment-Aware Trajectory Prediction はコメントを受け付けていません

MedMerge: Merging Models for Effective Transfer Learning to Medical Imaging Tasks

要約 転移学習は、深層学習モデルを初期化してより高速な収束とより高いパフォーマン … 続きを読む

カテゴリー: cs.CV | MedMerge: Merging Models for Effective Transfer Learning to Medical Imaging Tasks はコメントを受け付けていません

Gridless 2D Recovery of Lines using the Sliding Frank-Wolfe Algorithm

要約 我々は、劣化した画像におけるライン回復の課題に対処するために、Slidin … 続きを読む

カテゴリー: cs.CV, eess.IV, eess.SP | Gridless 2D Recovery of Lines using the Sliding Frank-Wolfe Algorithm はコメントを受け付けていません

Prioritized Semantic Learning for Zero-shot Instance Navigation

要約 私たちは、エージェントがトレーニングにオブジェクト アノテーションを使用せ … 続きを読む

カテゴリー: cs.CV | Prioritized Semantic Learning for Zero-shot Instance Navigation はコメントを受け付けていません

LocalStyleFool: Regional Video Style Transfer Attack Using Segment Anything Model

要約 これまでの研究では、巧妙に作成された敵対的な摂動がビデオ認識システムのセキ … 続きを読む

カテゴリー: cs.CV | LocalStyleFool: Regional Video Style Transfer Attack Using Segment Anything Model はコメントを受け付けていません

ECAMP: Entity-centered Context-aware Medical Vision Language Pre-training

要約 医療視覚言語の事前トレーニングは大幅に進歩したにもかかわらず、既存の手法で … 続きを読む

カテゴリー: cs.CV | ECAMP: Entity-centered Context-aware Medical Vision Language Pre-training はコメントを受け付けていません

Stop Reasoning! When Multimodal LLMs with Chain-of-Thought Reasoning Meets Adversarial Images

要約 最近、マルチモーダル LLM (MLLM) は画像を理解する優れた能力を示 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV, cs.LG | Stop Reasoning! When Multimodal LLMs with Chain-of-Thought Reasoning Meets Adversarial Images はコメントを受け付けていません

Histo-Genomic Knowledge Distillation For Cancer Prognosis From Histopathology Whole Slide Images

要約 組織ゲノムのマルチモーダルな手法が最近強力なパラダイムとして台頭し、がんの … 続きを読む

カテゴリー: cs.CV, eess.IV | Histo-Genomic Knowledge Distillation For Cancer Prognosis From Histopathology Whole Slide Images はコメントを受け付けていません

Normalized Validity Scores for DNNs in Regression based Eye Feature Extraction

要約 ランドマークの有効性の損失に対する改善を提案します。 ランドマーク検出は、 … 続きを読む

カテゴリー: cs.CV | Normalized Validity Scores for DNNs in Regression based Eye Feature Extraction はコメントを受け付けていません