月別アーカイブ: 2022年6月

Enhancing Egocentric 3D Pose Estimation with Third Person Views

要約 この論文では、単一のウェアラブルカメラからキャプチャされたビデオから計算さ … 続きを読む

カテゴリー: cs.CV | Enhancing Egocentric 3D Pose Estimation with Third Person Views はコメントを受け付けていません

Bringing Image Scene Structure to Video via Frame-Clip Consistency of Object Tokens

要約 最近の行動認識モデルは、オブジェクト、その位置、および相互作用を統合するこ … 続きを読む

カテゴリー: cs.CV | Bringing Image Scene Structure to Video via Frame-Clip Consistency of Object Tokens はコメントを受け付けていません

Real3D-Aug: Point Cloud Augmentation by Placing Real Objects with Occlusion Handling for 3D Detection and Segmentation

要約 3D LIDARポイントクラウドデータを使用したオブジェクト検出とセマンテ … 続きを読む

カテゴリー: cs.AI, cs.CV | Real3D-Aug: Point Cloud Augmentation by Placing Real Objects with Occlusion Handling for 3D Detection and Segmentation はコメントを受け付けていません

Coarse-to-Fine Vision-Language Pre-training with Fusion in the Backbone

要約 視覚言語(VL)の事前トレーニングは、最近かなりの注目を集めています。 た … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Coarse-to-Fine Vision-Language Pre-training with Fusion in the Backbone はコメントを受け付けていません

Learning a model of shape selectivity in V4 cells reveals shape encoding mechanisms in the brain

要約 初期の視覚信号をV4の曲率表現に変換することに関与するメカニズムは不明です … 続きを読む

カテゴリー: cs.CV, q-bio.NC | Learning a model of shape selectivity in V4 cells reveals shape encoding mechanisms in the brain はコメントを受け付けていません

Multimodal Dual Emotion with Fusion of Visual Sentiment for Rumor Detection

要約 近年、うわさは社会に壊滅的な影響を及ぼしており、うわさの検出は重要な課題と … 続きを読む

カテゴリー: cs.CV, cs.CY | Multimodal Dual Emotion with Fusion of Visual Sentiment for Rumor Detection はコメントを受け付けていません

SP-ViT: Learning 2D Spatial Priors for Vision Transformers

要約 最近、トランスフォーマーは画像分類において大きな可能性を示し、ImageN … 続きを読む

カテゴリー: cs.CV, I.4 | SP-ViT: Learning 2D Spatial Priors for Vision Transformers はコメントを受け付けていません

CRISP – Reliable Uncertainty Estimation for Medical Image Segmentation

要約 正確な不確実性の推定は、医用画像コミュニティにとって非常に重要です。 さま … 続きを読む

カテゴリー: cs.CV, eess.IV | CRISP – Reliable Uncertainty Estimation for Medical Image Segmentation はコメントを受け付けていません

A Unified Sequence Interface for Vision Tasks

要約 言語タスクは、単一の統一されたモデリングフレームワークで自然に表現されます … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | A Unified Sequence Interface for Vision Tasks はコメントを受け付けていません

VRT: A Video Restoration Transformer

要約 ビデオの復元(ビデオの超解像など)は、低品質のフレームから高品質のフレーム … 続きを読む

カテゴリー: cs.CV, eess.IV | VRT: A Video Restoration Transformer はコメントを受け付けていません