-
最近の投稿
- Adaptive Target Localization under Uncertainty using Multi-Agent Deep Reinforcement Learning with Knowledge Transfer
- Factor Graph-Based Active SLAM for Spacecraft Proximity Operations
- VIEW: Visual Imitation Learning with Waypoints
- Front Hair Styling Robot System Using Path Planning for Root-Centric Strand Adjustment
- Audio Array-Based 3D UAV Trajectory Estimation with LiDAR Pseudo-Labeling
-
最近のコメント
表示できるコメントはありません。 cs.AI (32521) cs.CL (24587) cs.CR (2516) cs.CV (38727) cs.LG (37397) cs.RO (18958) cs.SY (2900) eess.IV (4641) eess.SY (2894) stat.ML (4935)
「68T45」カテゴリーアーカイブ
Transformer-Based Model for Monocular Visual Odometry: A Video Understanding Approach
要約 単一のカメラからの画像からカメラの姿勢を推定することは、移動ロボットや自律 … 続きを読む
MVTamperBench: Evaluating Robustness of Vision-Language Models
要約 マルチモーダル大規模言語モデル (MLLM) は、ビデオの理解において大き … 続きを読む
A Survey on Dynamic Neural Networks: from Computer Vision to Multi-modal Sensor Fusion
要約 モデル圧縮は、組み込みデバイス上に大規模な Computer Vision … 続きを読む
Extraction Of Cumulative Blobs From Dynamic Gestures
要約 ジェスチャ認識は、コンピューターが人間の動きをコマンドとして解釈できるよう … 続きを読む
NeurTV: Total Variation on the Neural Domain
要約 最近、多くのイメージング アプリケーションでトータル バリエーション (T … 続きを読む
Causal Deep Learning
要約 私たちは、因果的ディープ ニューラル ネットワークのセットを導出します。そ … 続きを読む
ReFlow6D: Refraction-Guided Transparent Object 6D Pose Estimation via Intermediate Representation Learning
要約 透明な物体は日常生活のいたるところに存在しており、その認識とロボットによる … 続きを読む
LatentForensics: Towards frugal deepfake detection in the StyleGAN latent space
要約 偽造ビデオの分類はここ数年の課題でした。 ディープフェイク分類器は、ビデオ … 続きを読む
MVTamperBench: Evaluating Robustness of Vision-Language Models
要約 視覚言語モデル (VLM) の最近の進歩により、複雑なビデオ理解タスクが大 … 続きを読む