投稿者「jarxiv」のアーカイブ

SpikeGen: Generative Framework for Visual Spike Stream Processing

要約 スパイクカメラなどの神経型の視覚システムは、動的な条件下で透明なテクスチャ … 続きを読む

カテゴリー: cs.CV | SpikeGen: Generative Framework for Visual Spike Stream Processing はコメントを受け付けていません

LookWhere? Efficient Visual Recognition by Learning Where to Look and What to See from Self-Supervision

要約 視覚変圧器は、より大きく、より正確で、計算がより高価です。 トークンの数は … 続きを読む

カテゴリー: cs.CV | LookWhere? Efficient Visual Recognition by Learning Where to Look and What to See from Self-Supervision はコメントを受け付けていません

BOTM: Echocardiography Segmentation via Bi-directional Optimal Token Matching

要約 存在した心エコー検査セグメンテーション法は、形状の変動、部分観察、および2 … 続きを読む

カテゴリー: cs.CV | BOTM: Echocardiography Segmentation via Bi-directional Optimal Token Matching はコメントを受け付けていません

FDBPL: Faster Distillation-Based Prompt Learning for Region-Aware Vision-Language Models Adaptation

要約 視覚言語モデル(VLM)をダウンストリームタスクに適応させるために広く採用 … 続きを読む

カテゴリー: cs.AI, cs.CV | FDBPL: Faster Distillation-Based Prompt Learning for Region-Aware Vision-Language Models Adaptation はコメントを受け付けていません

Multi-Faceted Multimodal Monosemanticity

要約 人間は、ビジョン、言語、スピーチなどの複数のモダリティを通じて世界を経験し … 続きを読む

カテゴリー: cs.AI, cs.CV | Multi-Faceted Multimodal Monosemanticity はコメントを受け付けていません

A Foundation Model Framework for Multi-View MRI Classification of Extramural Vascular Invasion and Mesorectal Fascia Invasion in Rectal Cancer

要約 背景:壁外血管浸潤(EVI)およびメソレクトル筋膜浸潤(MFI)の正確なM … 続きを読む

カテゴリー: cs.CV, eess.IV | A Foundation Model Framework for Multi-View MRI Classification of Extramural Vascular Invasion and Mesorectal Fascia Invasion in Rectal Cancer はコメントを受け付けていません

Semantic Correspondence: Unified Benchmarking and a Strong Baseline

要約 セマンティック対応を確立することは、キーポイントを異なる画像間で同じセマン … 続きを読む

カテゴリー: cs.CV | Semantic Correspondence: Unified Benchmarking and a Strong Baseline はコメントを受け付けていません

Forensics Adapter: Unleashing CLIP for Generalizable Face Forgery Detection

要約 Clipを効果的で一般化可能なFace Forgery Detectorに … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | Forensics Adapter: Unleashing CLIP for Generalizable Face Forgery Detection はコメントを受け付けていません

DanceTogether! Identity-Preserving Multi-Person Interactive Video Generation

要約 制御可能なビデオ生成(CVG)は迅速に進歩していますが、複数のアクターが騒 … 続きを読む

カテゴリー: cs.CV | DanceTogether! Identity-Preserving Multi-Person Interactive Video Generation はコメントを受け付けていません

Deep Video Discovery: Agentic Search with Tool Use for Long-form Video Understanding

要約 長型のビデオ理解は、広範な時間空間的な複雑さと、そのような拡張されたコンテ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Deep Video Discovery: Agentic Search with Tool Use for Long-form Video Understanding はコメントを受け付けていません