月別アーカイブ: 2023年2月

Parallel Residual Bi-Fusion Feature Pyramid Network for Accurate Single-Shot Object Detection

要約 この論文では、高速で正確なシングル ショット オブジェクト検出のための並列 … 続きを読む

カテゴリー: cs.CV | Parallel Residual Bi-Fusion Feature Pyramid Network for Accurate Single-Shot Object Detection はコメントを受け付けていません

On the Metrics for Evaluating Monocular Depth Estimation

要約 単眼深度推定 (MDE) を実行して、自動運転車 (AV) や運転支援の車 … 続きを読む

カテゴリー: cs.CV | On the Metrics for Evaluating Monocular Depth Estimation はコメントを受け付けていません

Medical Face Masks and Emotion Recognition from the Body: Insights from a Deep Learning Perspective

要約 COVID-19 パンデミックは間違いなく基準を変え、私たちの生活、特に社 … 続きを読む

カテゴリー: cs.CV, cs.LG, I.4 | Medical Face Masks and Emotion Recognition from the Body: Insights from a Deep Learning Perspective はコメントを受け付けていません

Large-scale Multi-Modal Pre-trained Models: A Comprehensive Survey

要約 一般化された深いモデルに対する緊急の需要により、BERT、ViT、GPT … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Large-scale Multi-Modal Pre-trained Models: A Comprehensive Survey はコメントを受け付けていません

Ontology-aware Network for Zero-shot Sketch-based Image Retrieval

要約 Zero-Shot Sketch-Based Image Retrieva … 続きを読む

カテゴリー: cs.CV | Ontology-aware Network for Zero-shot Sketch-based Image Retrieval はコメントを受け付けていません

Neural Systematic Binder

要約 高レベルの認知の鍵は、知識の断片を体系的に操作して構成する能力であると考え … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Neural Systematic Binder はコメントを受け付けていません

UAVStereo: A Multiple Resolution Dataset for Stereo Matching in UAV Scenarios

要約 ステレオ マッチングは、3D シーン再構成の基本的なタスクです。 最近、深 … 続きを読む

カテゴリー: cs.CV | UAVStereo: A Multiple Resolution Dataset for Stereo Matching in UAV Scenarios はコメントを受け付けていません

Why Deep Surgical Models Fail?: Revisiting Surgical Action Triplet Recognition through the Lens of Robustness

要約 手術行為のトリプレット認識により、手術シーンの理解が深まります。 このタス … 続きを読む

カテゴリー: cs.CV | Why Deep Surgical Models Fail?: Revisiting Surgical Action Triplet Recognition through the Lens of Robustness はコメントを受け付けていません

NerfDiff: Single-image View Synthesis with NeRF-guided Distillation from 3D-aware Diffusion

要約 単一の画像からの新しいビューの合成には、入力との意味的および物理的な一貫性 … 続きを読む

カテゴリー: cs.CV, cs.LG | NerfDiff: Single-image View Synthesis with NeRF-guided Distillation from 3D-aware Diffusion はコメントを受け付けていません

Champion Solution for the WSDM2023 Toloka VQA Challenge

要約 このレポートでは、WSDM2023 Toloka Visual Quest … 続きを読む

カテゴリー: cs.CV | Champion Solution for the WSDM2023 Toloka VQA Challenge はコメントを受け付けていません