68T45」カテゴリーアーカイブ

Transformer-Based Model for Monocular Visual Odometry: A Video Understanding Approach

要約 単一のカメラからの画像からカメラの姿勢を推定することは、移動ロボットや自律 … 続きを読む

カテゴリー: 68T07, 68T45, cs.AI, cs.CV, cs.RO | コメントする

MVTamperBench: Evaluating Robustness of Vision-Language Models

要約 マルチモーダル大規模言語モデル (MLLM) は、ビデオの理解において大き … 続きを読む

カテゴリー: 68Q32, 68Q85, 68T05, 68T37, 68T40, 68T45, 94A08, cs.CV, I.2.10 | コメントする

A Survey on Dynamic Neural Networks: from Computer Vision to Multi-modal Sensor Fusion

要約 モデル圧縮は、組み込みデバイス上に大規模な Computer Vision … 続きを読む

カテゴリー: 68T45, cs.CV, I.2.10 | コメントする

Extraction Of Cumulative Blobs From Dynamic Gestures

要約 ジェスチャ認識は、コンピューターが人間の動きをコマンドとして解釈できるよう … 続きを読む

カテゴリー: 68T45, 68U10, cs.CV, H.5.2 | Extraction Of Cumulative Blobs From Dynamic Gestures はコメントを受け付けていません

NeurTV: Total Variation on the Neural Domain

要約 最近、多くのイメージング アプリケーションでトータル バリエーション (T … 続きを読む

カテゴリー: 68T45, 68U10, 94A08, cs.CV, eess.IV | NeurTV: Total Variation on the Neural Domain はコメントを受け付けていません

Causal Deep Learning

要約 私たちは、因果的ディープ ニューラル ネットワークのセットを導出します。そ … 続きを読む

カテゴリー: (Primary), 15A09, 15A69, 15A72, 62D20, 62H25, 62H30, 62H35, 62J10, 68T45, cs.AI, cs.CV, cs.LG, G.3, stat.ML | Causal Deep Learning はコメントを受け付けていません

ReFlow6D: Refraction-Guided Transparent Object 6D Pose Estimation via Intermediate Representation Learning

要約 透明な物体は日常生活のいたるところに存在しており、その認識とロボットによる … 続きを読む

カテゴリー: 68T45, cs.CV, cs.RO, I.4.8 | ReFlow6D: Refraction-Guided Transparent Object 6D Pose Estimation via Intermediate Representation Learning はコメントを受け付けていません

LatentForensics: Towards frugal deepfake detection in the StyleGAN latent space

要約 偽造ビデオの分類はここ数年の課題でした。 ディープフェイク分類器は、ビデオ … 続きを読む

カテゴリー: 68T45, cs.CV, I.2.10 | LatentForensics: Towards frugal deepfake detection in the StyleGAN latent space はコメントを受け付けていません

MVTamperBench: Evaluating Robustness of Vision-Language Models

要約 視覚言語モデル (VLM) の最近の進歩により、複雑なビデオ理解タスクが大 … 続きを読む

カテゴリー: 68Q32, 68Q85, 68T05, 68T37, 68T40, 68T45, 94A08, cs.CV, I.2.10 | MVTamperBench: Evaluating Robustness of Vision-Language Models はコメントを受け付けていません

MVTamperBench: Evaluating Robustness of Vision-Language Models

要約 視覚言語モデル (VLM) の最近の進歩により、複雑なビデオ理解タスクが大 … 続きを読む

カテゴリー: 68Q32, 68Q85, 68T05, 68T37, 68T40, 68T45, 94A08, cs.CV, I.2.10 | MVTamperBench: Evaluating Robustness of Vision-Language Models はコメントを受け付けていません