月別アーカイブ: 2025年1月

Audio-Visual Deepfake Detection With Local Temporal Inconsistencies

投稿日: 2025年1月29日作成者: jarxiv

要約このペーパーでは、オーディオと視覚モダリティの間のきめの細かい時間的矛盾を … 続きを読む →

カテゴリー: cs.CR, cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Not Every Patch is Needed: Towards a More Efficient and Effective Backbone for Video-based Person Re-identification

投稿日: 2025年1月29日作成者: jarxiv

要約このペーパーでは、ビデオベースの人の再識別（Reid）のための新しい効果的 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Weakly-Supervised Learning via Multi-Lateral Decoder Branching for Tool Segmentation in Robot-Assisted Cardiovascular Catheterization

投稿日: 2025年1月29日作成者: jarxiv

要約ロボット支援カテーテルゼットは、心血管疾患の治療における可能性について十分 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Uni-Sign: Toward Unified Sign Language Understanding at Scale

投稿日: 2025年1月29日作成者: jarxiv

要約手話の事前トレーニングは、さまざまな手話理解（SLU）タスク全体でパフォー … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

GFE-Mamba: Mamba-based AD Multi-modal Progression Assessment via Generative Feature Extraction from MCI

投稿日: 2025年1月29日作成者: jarxiv

要約アルツハイマー病（AD）は、しばしば軽度の認知障害（MCI）に由来する進行 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

VideoLLaMA 3: Frontier Multimodal Foundation Models for Image and Video Understanding

投稿日: 2025年1月29日作成者: jarxiv

要約この論文では、画像とビデオの理解のためのより高度なマルチモーダルファンデー … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

StableMaterials: Enhancing Diversity in Material Generation via Semi-Supervised Learning

投稿日: 2025年1月29日作成者: jarxiv

要約 Stablematerialsを紹介します。これは、半監視学習を潜在的な拡 … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

Experimenting with Affective Computing Models in Video Interviews with Spanish-speaking Older Adults

投稿日: 2025年1月29日作成者: jarxiv

要約高齢者の感情的なシグナルを理解することは、彼らの幸福をサポートする仮想アシ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Ultra-high resolution multimodal MRI dense labelled holistic brain atlas

投稿日: 2025年1月29日作成者: jarxiv

要約この論文では、ホリスタ、ホリステル、ホリステル、マルチモーダル、高解像度の … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Extending Information Bottleneck Attribution to Video Sequences

投稿日: 2025年1月29日作成者: jarxiv

要約 Vibaを紹介します。これは、Attribution（IBA）の情報ボトル … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

月別アーカイブ: 2025年1月

Audio-Visual Deepfake Detection With Local Temporal Inconsistencies

Not Every Patch is Needed: Towards a More Efficient and Effective Backbone for Video-based Person Re-identification

Weakly-Supervised Learning via Multi-Lateral Decoder Branching for Tool Segmentation in Robot-Assisted Cardiovascular Catheterization

Uni-Sign: Toward Unified Sign Language Understanding at Scale

GFE-Mamba: Mamba-based AD Multi-modal Progression Assessment via Generative Feature Extraction from MCI

VideoLLaMA 3: Frontier Multimodal Foundation Models for Image and Video Understanding

StableMaterials: Enhancing Diversity in Material Generation via Semi-Supervised Learning

Experimenting with Affective Computing Models in Video Interviews with Spanish-speaking Older Adults

Ultra-high resolution multimodal MRI dense labelled holistic brain atlas

Extending Information Bottleneck Attribution to Video Sequences

最近の投稿

最近のコメント

アーカイブ

カテゴリー