月別アーカイブ: 2025年5月

A Foundation Model Framework for Multi-View MRI Classification of Extramural Vascular Invasion and Mesorectal Fascia Invasion in Rectal Cancer

要約 背景:壁外血管浸潤(EVI)およびメソレクトル筋膜浸潤(MFI)の正確なM … 続きを読む

カテゴリー: cs.CV, eess.IV | A Foundation Model Framework for Multi-View MRI Classification of Extramural Vascular Invasion and Mesorectal Fascia Invasion in Rectal Cancer はコメントを受け付けていません

Semantic Correspondence: Unified Benchmarking and a Strong Baseline

要約 セマンティック対応を確立することは、キーポイントを異なる画像間で同じセマン … 続きを読む

カテゴリー: cs.CV | Semantic Correspondence: Unified Benchmarking and a Strong Baseline はコメントを受け付けていません

Forensics Adapter: Unleashing CLIP for Generalizable Face Forgery Detection

要約 Clipを効果的で一般化可能なFace Forgery Detectorに … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | Forensics Adapter: Unleashing CLIP for Generalizable Face Forgery Detection はコメントを受け付けていません

DanceTogether! Identity-Preserving Multi-Person Interactive Video Generation

要約 制御可能なビデオ生成(CVG)は迅速に進歩していますが、複数のアクターが騒 … 続きを読む

カテゴリー: cs.CV | DanceTogether! Identity-Preserving Multi-Person Interactive Video Generation はコメントを受け付けていません

Deep Video Discovery: Agentic Search with Tool Use for Long-form Video Understanding

要約 長型のビデオ理解は、広範な時間空間的な複雑さと、そのような拡張されたコンテ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Deep Video Discovery: Agentic Search with Tool Use for Long-form Video Understanding はコメントを受け付けていません

CXReasonBench: A Benchmark for Evaluating Structured Diagnostic Reasoning in Chest X-rays

要約 大規模な視覚言語モデル(LVLMS)の最近の進捗により、レポート生成や視覚 … 続きを読む

カテゴリー: cs.AI, cs.CV | CXReasonBench: A Benchmark for Evaluating Structured Diagnostic Reasoning in Chest X-rays はコメントを受け付けていません

DualTalk: Dual-Speaker Interaction for 3D Talking Head Conversations

要約 対面での会話では、個人はスピーキングとリスニングの役割を切り替える必要があ … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | DualTalk: Dual-Speaker Interaction for 3D Talking Head Conversations はコメントを受け付けていません

Towards more transferable adversarial attack in black-box manner

要約 敵対的な攻撃は十分に標準のドメインになり、モデルの堅牢性の評価ベースライン … 続きを読む

カテゴリー: cs.CV, cs.LG | Towards more transferable adversarial attack in black-box manner はコメントを受け付けていません

F-ANcGAN: An Attention-Enhanced Cycle Consistent Generative Adversarial Architecture for Synthetic Image Generation of Nanoparticles

要約 ナノ材料研究は、エネルギー、医学、材料科学にとって重要な分野になりつつあり … 続きを読む

カテゴリー: cond-mat.mtrl-sci, cs.CV, cs.LG, eess.IV | F-ANcGAN: An Attention-Enhanced Cycle Consistent Generative Adversarial Architecture for Synthetic Image Generation of Nanoparticles はコメントを受け付けていません

ViFOR: A Fourier-Enhanced Vision Transformer for Multi-Image Super-Resolution in Earth System

要約 スーパー解像度(SR)技術は、地球システムモデル(ESM)データの空間解像 … 続きを読む

カテゴリー: cs.CV | ViFOR: A Fourier-Enhanced Vision Transformer for Multi-Image Super-Resolution in Earth System はコメントを受け付けていません