月別アーカイブ: 2025年1月

Audio-Visual Deepfake Detection With Local Temporal Inconsistencies

要約 このペーパーでは、オーディオと視覚モダリティの間のきめの細かい時間的矛盾を … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.MM, cs.SD, eess.AS | Audio-Visual Deepfake Detection With Local Temporal Inconsistencies はコメントを受け付けていません

Not Every Patch is Needed: Towards a More Efficient and Effective Backbone for Video-based Person Re-identification

要約 このペーパーでは、ビデオベースの人の再識別(Reid)のための新しい効果的 … 続きを読む

カテゴリー: cs.CV | Not Every Patch is Needed: Towards a More Efficient and Effective Backbone for Video-based Person Re-identification はコメントを受け付けていません

Weakly-Supervised Learning via Multi-Lateral Decoder Branching for Tool Segmentation in Robot-Assisted Cardiovascular Catheterization

要約 ロボット支援カテーテルゼットは、心血管疾患の治療における可能性について十分 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Weakly-Supervised Learning via Multi-Lateral Decoder Branching for Tool Segmentation in Robot-Assisted Cardiovascular Catheterization はコメントを受け付けていません

Uni-Sign: Toward Unified Sign Language Understanding at Scale

要約 手話の事前トレーニングは、さまざまな手話理解(SLU)タスク全体でパフォー … 続きを読む

カテゴリー: cs.CV | Uni-Sign: Toward Unified Sign Language Understanding at Scale はコメントを受け付けていません

GFE-Mamba: Mamba-based AD Multi-modal Progression Assessment via Generative Feature Extraction from MCI

要約 アルツハイマー病(AD)は、しばしば軽度の認知障害(MCI)に由来する進行 … 続きを読む

カテゴリー: cs.AI, cs.CV | GFE-Mamba: Mamba-based AD Multi-modal Progression Assessment via Generative Feature Extraction from MCI はコメントを受け付けていません

VideoLLaMA 3: Frontier Multimodal Foundation Models for Image and Video Understanding

要約 この論文では、画像とビデオの理解のためのより高度なマルチモーダルファンデー … 続きを読む

カテゴリー: cs.CV | VideoLLaMA 3: Frontier Multimodal Foundation Models for Image and Video Understanding はコメントを受け付けていません

StableMaterials: Enhancing Diversity in Material Generation via Semi-Supervised Learning

要約 Stablematerialsを紹介します。これは、半監視学習を潜在的な拡 … 続きを読む

カテゴリー: cs.CV, cs.GR | StableMaterials: Enhancing Diversity in Material Generation via Semi-Supervised Learning はコメントを受け付けていません

Experimenting with Affective Computing Models in Video Interviews with Spanish-speaking Older Adults

要約 高齢者の感情的なシグナルを理解することは、彼らの幸福をサポートする仮想アシ … 続きを読む

カテゴリー: cs.CV | Experimenting with Affective Computing Models in Video Interviews with Spanish-speaking Older Adults はコメントを受け付けていません

Ultra-high resolution multimodal MRI dense labelled holistic brain atlas

要約 この論文では、ホリスタ、ホリステル、ホリステル、マルチモーダル、高解像度の … 続きを読む

カテゴリー: cs.CV, eess.IV | Ultra-high resolution multimodal MRI dense labelled holistic brain atlas はコメントを受け付けていません

Extending Information Bottleneck Attribution to Video Sequences

要約 Vibaを紹介します。これは、Attribution(IBA)の情報ボトル … 続きを読む

カテゴリー: cs.AI, cs.CV | Extending Information Bottleneck Attribution to Video Sequences はコメントを受け付けていません