月別アーカイブ: 2024年8月

SynesLM: A Unified Approach for Audio-visual Speech Recognition and Translation via Language Model and Synthetic Data

投稿日: 2024年8月4日作成者: jarxiv

要約本論文では、3つのマルチモーダル言語理解タスク、AV-ASR（視聴覚自動音 … 続きを読む →

カテゴリー: cs.CL, cs.CV, eess.AS | コメントを受け付けていません

Empowering Snapshot Compressive Imaging: Spatial-Spectral State Space Model with Across-Scanning and Local Enhancement

投稿日: 2024年8月4日作成者: jarxiv

要約スナップショット圧縮イメージング（SCI）は、圧縮された測定値からハイパー … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Deep Learning in Medical Image Classification from MRI-based Brain Tumor Images

投稿日: 2024年8月4日作成者: jarxiv

要約脳腫瘍は世界で最も致命的な病気の一つである。磁気共鳴画像法（MRI）は脳腫 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Privacy-preserving datasets by capturing feature distributions with Conditional VAEs

投稿日: 2024年8月4日作成者: jarxiv

要約ディープラーニングのアプリケーションを発展させるためには、大規模で注釈の充 … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

AMAES: Augmented Masked Autoencoder Pretraining on Public Brain MRI Data for 3D-Native Segmentation

投稿日: 2024年8月4日作成者: jarxiv

要約本研究では、3Dセマンティックセグメンテーションモデルの自己教師付き事前学 … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

Towards End-to-End Explainable Facial Action Unit Recognition via Vision-Language Joint Learning

投稿日: 2024年8月4日作成者: jarxiv

要約フェイシャル・アクション・コーディング・システム（Facial Actio … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SF3D: Stable Fast 3D Mesh Reconstruction with UV-unwrapping and Illumination Disentanglement

投稿日: 2024年8月4日作成者: jarxiv

要約 SF3Dは、1枚の画像からわずか0.5秒でテクスチャ付きオブジェクトのメッ … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

ExpertAF: Expert Actionable Feedback from Video

投稿日: 2024年8月4日作成者: jarxiv

要約新しいスキルを習得したり、現在のスキルレベルを向上させたりするためには、フ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Scaling Backwards: Minimal Synthetic Pre-training?

投稿日: 2024年8月4日作成者: jarxiv

要約事前学習と転移学習は、現在のコンピュータビジョンシステムの重要な構成要素で … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Joint Neural Networks for One-shot Object Recognition and Detection

投稿日: 2024年8月4日作成者: jarxiv

要約本稿では、難易度の高いワンショット物体認識・検出タスクに対処するための、新 … 続きを読む →

カテゴリー: 68T45, cs.CV, I.5.4 | コメントを受け付けていません

月別アーカイブ: 2024年8月

SynesLM: A Unified Approach for Audio-visual Speech Recognition and Translation via Language Model and Synthetic Data

Empowering Snapshot Compressive Imaging: Spatial-Spectral State Space Model with Across-Scanning and Local Enhancement

Deep Learning in Medical Image Classification from MRI-based Brain Tumor Images

Privacy-preserving datasets by capturing feature distributions with Conditional VAEs

AMAES: Augmented Masked Autoencoder Pretraining on Public Brain MRI Data for 3D-Native Segmentation

Towards End-to-End Explainable Facial Action Unit Recognition via Vision-Language Joint Learning

SF3D: Stable Fast 3D Mesh Reconstruction with UV-unwrapping and Illumination Disentanglement

ExpertAF: Expert Actionable Feedback from Video

Scaling Backwards: Minimal Synthetic Pre-training?

Joint Neural Networks for One-shot Object Recognition and Detection

最近の投稿

最近のコメント

アーカイブ

カテゴリー