月別アーカイブ: 2024年8月

SynesLM: A Unified Approach for Audio-visual Speech Recognition and Translation via Language Model and Synthetic Data

要約 本論文では、3つのマルチモーダル言語理解タスク、AV-ASR(視聴覚自動音 … 続きを読む

カテゴリー: cs.CL, cs.CV, eess.AS | SynesLM: A Unified Approach for Audio-visual Speech Recognition and Translation via Language Model and Synthetic Data はコメントを受け付けていません

Empowering Snapshot Compressive Imaging: Spatial-Spectral State Space Model with Across-Scanning and Local Enhancement

要約 スナップショット圧縮イメージング(SCI)は、圧縮された測定値からハイパー … 続きを読む

カテゴリー: cs.CV, eess.IV | Empowering Snapshot Compressive Imaging: Spatial-Spectral State Space Model with Across-Scanning and Local Enhancement はコメントを受け付けていません

Deep Learning in Medical Image Classification from MRI-based Brain Tumor Images

要約 脳腫瘍は世界で最も致命的な病気の一つである。磁気共鳴画像法(MRI)は脳腫 … 続きを読む

カテゴリー: cs.CV | Deep Learning in Medical Image Classification from MRI-based Brain Tumor Images はコメントを受け付けていません

Privacy-preserving datasets by capturing feature distributions with Conditional VAEs

要約 ディープラーニングのアプリケーションを発展させるためには、大規模で注釈の充 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Privacy-preserving datasets by capturing feature distributions with Conditional VAEs はコメントを受け付けていません

AMAES: Augmented Masked Autoencoder Pretraining on Public Brain MRI Data for 3D-Native Segmentation

要約 本研究では、3Dセマンティックセグメンテーションモデルの自己教師付き事前学 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | AMAES: Augmented Masked Autoencoder Pretraining on Public Brain MRI Data for 3D-Native Segmentation はコメントを受け付けていません

Towards End-to-End Explainable Facial Action Unit Recognition via Vision-Language Joint Learning

要約 フェイシャル・アクション・コーディング・システム(Facial Actio … 続きを読む

カテゴリー: cs.CV | Towards End-to-End Explainable Facial Action Unit Recognition via Vision-Language Joint Learning はコメントを受け付けていません

SF3D: Stable Fast 3D Mesh Reconstruction with UV-unwrapping and Illumination Disentanglement

要約 SF3Dは、1枚の画像からわずか0.5秒でテクスチャ付きオブジェクトのメッ … 続きを読む

カテゴリー: cs.CV, cs.GR | SF3D: Stable Fast 3D Mesh Reconstruction with UV-unwrapping and Illumination Disentanglement はコメントを受け付けていません

ExpertAF: Expert Actionable Feedback from Video

要約 新しいスキルを習得したり、現在のスキルレベルを向上させたりするためには、フ … 続きを読む

カテゴリー: cs.CV | ExpertAF: Expert Actionable Feedback from Video はコメントを受け付けていません

Scaling Backwards: Minimal Synthetic Pre-training?

要約 事前学習と転移学習は、現在のコンピュータビジョンシステムの重要な構成要素で … 続きを読む

カテゴリー: cs.CV | Scaling Backwards: Minimal Synthetic Pre-training? はコメントを受け付けていません

Joint Neural Networks for One-shot Object Recognition and Detection

要約 本稿では、難易度の高いワンショット物体認識・検出タスクに対処するための、新 … 続きを読む

カテゴリー: 68T45, cs.CV, I.5.4 | Joint Neural Networks for One-shot Object Recognition and Detection はコメントを受け付けていません