月別アーカイブ: 2023年2月

Parallel Residual Bi-Fusion Feature Pyramid Network for Accurate Single-Shot Object Detection

投稿日: 2023年2月21日作成者: jarxiv

要約この論文では、高速で正確なシングルショットオブジェクト検出のための並列 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

On the Metrics for Evaluating Monocular Depth Estimation

投稿日: 2023年2月21日作成者: jarxiv

要約単眼深度推定 (MDE) を実行して、自動運転車 (AV) や運転支援の車 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Medical Face Masks and Emotion Recognition from the Body: Insights from a Deep Learning Perspective

投稿日: 2023年2月21日作成者: jarxiv

要約 COVID-19 パンデミックは間違いなく基準を変え、私たちの生活、特に社 … 続きを読む →

カテゴリー: cs.CV, cs.LG, I.4 | コメントを受け付けていません

Large-scale Multi-Modal Pre-trained Models: A Comprehensive Survey

投稿日: 2023年2月21日作成者: jarxiv

要約一般化された深いモデルに対する緊急の需要により、BERT、ViT、GPT … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

Ontology-aware Network for Zero-shot Sketch-based Image Retrieval

投稿日: 2023年2月21日作成者: jarxiv

要約 Zero-Shot Sketch-Based Image Retrieva … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Neural Systematic Binder

投稿日: 2023年2月21日作成者: jarxiv

要約高レベルの認知の鍵は、知識の断片を体系的に操作して構成する能力であると考え … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

UAVStereo: A Multiple Resolution Dataset for Stereo Matching in UAV Scenarios

投稿日: 2023年2月21日作成者: jarxiv

要約ステレオマッチングは、3D シーン再構成の基本的なタスクです。最近、深 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Why Deep Surgical Models Fail?: Revisiting Surgical Action Triplet Recognition through the Lens of Robustness

投稿日: 2023年2月21日作成者: jarxiv

要約手術行為のトリプレット認識により、手術シーンの理解が深まります。このタス … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

NerfDiff: Single-image View Synthesis with NeRF-guided Distillation from 3D-aware Diffusion

投稿日: 2023年2月21日作成者: jarxiv

要約単一の画像からの新しいビューの合成には、入力との意味的および物理的な一貫性 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Champion Solution for the WSDM2023 Toloka VQA Challenge

投稿日: 2023年2月21日作成者: jarxiv

要約このレポートでは、WSDM2023 Toloka Visual Quest … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2023年2月

Parallel Residual Bi-Fusion Feature Pyramid Network for Accurate Single-Shot Object Detection

On the Metrics for Evaluating Monocular Depth Estimation

Medical Face Masks and Emotion Recognition from the Body: Insights from a Deep Learning Perspective

Large-scale Multi-Modal Pre-trained Models: A Comprehensive Survey

Ontology-aware Network for Zero-shot Sketch-based Image Retrieval

Neural Systematic Binder

UAVStereo: A Multiple Resolution Dataset for Stereo Matching in UAV Scenarios

Why Deep Surgical Models Fail?: Revisiting Surgical Action Triplet Recognition through the Lens of Robustness

NerfDiff: Single-image View Synthesis with NeRF-guided Distillation from 3D-aware Diffusion

Champion Solution for the WSDM2023 Toloka VQA Challenge

最近の投稿

最近のコメント

アーカイブ

カテゴリー