月別アーカイブ: 2022年6月

AVATAR: Unconstrained Audiovisual Speech Recognition

要約 視聴覚自動音声認識(AV-ASR)は、ASRの拡張機能であり、多くの場合、 … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | AVATAR: Unconstrained Audiovisual Speech Recognition はコメントを受け付けていません

CAINNFlow: Convolutional block Attention modules and Invertible Neural Networks Flow for anomaly detection and localization tasks

要約 オブジェクトの異常の検出は、産業プロセスでは非常に重要ですが、教師なし異常 … 続きを読む

カテゴリー: cs.AI, cs.CV | CAINNFlow: Convolutional block Attention modules and Invertible Neural Networks Flow for anomaly detection and localization tasks はコメントを受け付けていません

Residual Sparsity Connection Learning for Efficient Video Super-Resolution

要約 スマートフォンやウェアラブルデバイスなど、リソースが限られたデバイスにビデ … 続きを読む

カテゴリー: cs.CV, eess.IV | Residual Sparsity Connection Learning for Efficient Video Super-Resolution はコメントを受け付けていません

Structured Video Tokens @ Ego4D PNR Temporal Localization Challenge 2022

要約 このテクニカルレポートでは、Ego4Dポイントオブノーリターン(PNR)の … 続きを読む

カテゴリー: cs.CV | Structured Video Tokens @ Ego4D PNR Temporal Localization Challenge 2022 はコメントを受け付けていません

ELUDE: Generating interpretable explanations via a decomposition into labelled and unlabelled features

要約 ディープラーニングモデルは、過去10年間、機械学習のさまざまな分野で目覚ま … 続きを読む

カテゴリー: cs.CV, cs.LG | ELUDE: Generating interpretable explanations via a decomposition into labelled and unlabelled features はコメントを受け付けていません

A Simple Data Mixing Prior for Improving Self-Supervised Learning

要約 データミキシング(Mixup、Cutmix、ResizeMixなど)は、認 … 続きを読む

カテゴリー: cs.CV | A Simple Data Mixing Prior for Improving Self-Supervised Learning はコメントを受け付けていません

PhysGNN: A Physics-Driven Graph Neural Network Based Model for Predicting Soft Tissue Deformation in Image-Guided Neurosurgery

要約 画像誘導脳神経外科手術で術中の脳シフトを正しくキャプチャすることは、正確な … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | PhysGNN: A Physics-Driven Graph Neural Network Based Model for Predicting Soft Tissue Deformation in Image-Guided Neurosurgery はコメントを受け付けていません

VoxGRAF: Fast 3D-Aware Image Synthesis with Sparse Voxel Grids

要約 最先端の3D対応の生成モデルは、座標ベースのMLPに依存して3D放射輝度フ … 続きを読む

カテゴリー: cs.CV | VoxGRAF: Fast 3D-Aware Image Synthesis with Sparse Voxel Grids はコメントを受け付けていません

Diffusion Models for Video Prediction and Infilling

要約 シーケンス内の情報の欠落に関する将来の結果または理由を予測および予測するこ … 続きを読む

カテゴリー: cs.CV, cs.LG, stat.ML | Diffusion Models for Video Prediction and Infilling はコメントを受け付けていません

Neural Deformable Voxel Grid for Fast Optimization of Dynamic View Synthesis

要約 最近、Neural Radiance Fields(NeRF)は、その優れ … 続きを読む

カテゴリー: cs.CV | Neural Deformable Voxel Grid for Fast Optimization of Dynamic View Synthesis はコメントを受け付けていません