-
最近の投稿
- MCRL4OR: Multimodal Contrastive Representation Learning for Off-Road Environmental Perception
- CSAOT: Cooperative Multi-Agent System for Active Object Tracking
- Integrating Persian Lip Reading in Surena-V Humanoid Robot for Human-Robot Interaction
- The Perceived Danger (PD) Scale: Development and Validation
- Design and Implementation of an Efficient Onboard Computer System for CanSat Atmosphere Monitoring
-
最近のコメント
表示できるコメントはありません。 cs.AI (32726) cs.CL (24738) cs.CR (2529) cs.CV (38903) cs.LG (37605) cs.RO (19038) cs.SY (2911) eess.IV (4662) eess.SY (2905) stat.ML (4954)
「68T45」カテゴリーアーカイブ
A polynomial formula for the perspective four points problem
要約 n=4 の場合に対する新しいアプローチにより、透視 n 点問題に対する高速 … 続きを読む
Transformer-Based Model for Monocular Visual Odometry: A Video Understanding Approach
要約 単一のカメラからの画像からカメラの姿勢を推定することは、移動ロボットや自律 … 続きを読む
MVTamperBench: Evaluating Robustness of Vision-Language Models
要約 マルチモーダル大規模言語モデル (MLLM) は、ビデオの理解において大き … 続きを読む
A Survey on Dynamic Neural Networks: from Computer Vision to Multi-modal Sensor Fusion
要約 モデル圧縮は、組み込みデバイス上に大規模な Computer Vision … 続きを読む
Extraction Of Cumulative Blobs From Dynamic Gestures
要約 ジェスチャ認識は、コンピューターが人間の動きをコマンドとして解釈できるよう … 続きを読む
NeurTV: Total Variation on the Neural Domain
要約 最近、多くのイメージング アプリケーションでトータル バリエーション (T … 続きを読む
Causal Deep Learning
要約 私たちは、因果的ディープ ニューラル ネットワークのセットを導出します。そ … 続きを読む
ReFlow6D: Refraction-Guided Transparent Object 6D Pose Estimation via Intermediate Representation Learning
要約 透明な物体は日常生活のいたるところに存在しており、その認識とロボットによる … 続きを読む
LatentForensics: Towards frugal deepfake detection in the StyleGAN latent space
要約 偽造ビデオの分類はここ数年の課題でした。 ディープフェイク分類器は、ビデオ … 続きを読む