-
最近の投稿
- Multimodal Active Measurement for Human Mesh Recovery in Close Proximity
- An Algorithm for Distributed Computation of Reachable Sets for Multi-Agent Systems
- Meta-Learning Augmented MPC for Disturbance-Aware Motion Planning and Control of Quadrotors
- Solving Multi-Goal Robotic Tasks with Decision Transformer
- Context-Aware Command Understanding for Tabletop Scenarios
-
最近のコメント
表示できるコメントはありません。 cs.AI (27848) cs.CL (21045) cs.CR (2180) cs.CV (34554) cs.LG (32592) cs.RO (15968) cs.SY (2478) eess.IV (4238) eess.SY (2472) stat.ML (4364)
月別アーカイブ: 2022年6月
Enhancing Egocentric 3D Pose Estimation with Third Person Views
要約 この論文では、単一のウェアラブルカメラからキャプチャされたビデオから計算さ … 続きを読む
カテゴリー: cs.CV
Enhancing Egocentric 3D Pose Estimation with Third Person Views はコメントを受け付けていません
Bringing Image Scene Structure to Video via Frame-Clip Consistency of Object Tokens
要約 最近の行動認識モデルは、オブジェクト、その位置、および相互作用を統合するこ … 続きを読む
カテゴリー: cs.CV
Bringing Image Scene Structure to Video via Frame-Clip Consistency of Object Tokens はコメントを受け付けていません
Real3D-Aug: Point Cloud Augmentation by Placing Real Objects with Occlusion Handling for 3D Detection and Segmentation
要約 3D LIDARポイントクラウドデータを使用したオブジェクト検出とセマンテ … 続きを読む
Coarse-to-Fine Vision-Language Pre-training with Fusion in the Backbone
要約 視覚言語(VL)の事前トレーニングは、最近かなりの注目を集めています。 た … 続きを読む
Learning a model of shape selectivity in V4 cells reveals shape encoding mechanisms in the brain
要約 初期の視覚信号をV4の曲率表現に変換することに関与するメカニズムは不明です … 続きを読む
Multimodal Dual Emotion with Fusion of Visual Sentiment for Rumor Detection
要約 近年、うわさは社会に壊滅的な影響を及ぼしており、うわさの検出は重要な課題と … 続きを読む
SP-ViT: Learning 2D Spatial Priors for Vision Transformers
要約 最近、トランスフォーマーは画像分類において大きな可能性を示し、ImageN … 続きを読む
CRISP – Reliable Uncertainty Estimation for Medical Image Segmentation
要約 正確な不確実性の推定は、医用画像コミュニティにとって非常に重要です。 さま … 続きを読む
A Unified Sequence Interface for Vision Tasks
要約 言語タスクは、単一の統一されたモデリングフレームワークで自然に表現されます … 続きを読む
VRT: A Video Restoration Transformer
要約 ビデオの復元(ビデオの超解像など)は、低品質のフレームから高品質のフレーム … 続きを読む