cs.CV」カテゴリーアーカイブ

DFREC: DeepFake Identity Recovery Based on Identity-aware Masked Autoencoder

要約 Deepfake Forensicsの最近の進歩は、主に分類の精度と一般化 … 続きを読む

カテゴリー: cs.CV | コメントする

Perceptual Multi-Exposure Fusion

要約 高ダイナミックレンジ(HDR)シーン撮影に対するますます増え続ける需要とし … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする

VideoWorld: Exploring Knowledge Learning from Unlabeled Videos

要約 この作業では、深い生成モデルが、大規模な言語モデル(LLMS)などのテキス … 続きを読む

カテゴリー: cs.CV | コメントする

Afford-X: Generalizable and Slim Affordance Reasoning for Task-oriented Manipulation

要約 物理的特性に基づいてオブジェクト機能を推測する能力であるオブジェクトアフォ … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

High-Quality Virtual Single-Viewpoint Surgical Video: Geometric Autocalibration of Multiple Cameras in Surgical Lights

要約 閉塞のないビデオ生成は、カメラの視野での外科医の妨害のために困難です。 一 … 続きを読む

カテゴリー: cs.CV | コメントする

Safety Without Semantic Disruptions: Editing-free Safe Image Generation via Context-preserving Dual Latent Reconstruction

要約 大規模で未確認のデータセットでマルチモーダル生成モデルをトレーニングすると … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

Towards Visual Discrimination and Reasoning of Real-World Physical Dynamics: Physics-Grounded Anomaly Detection

要約 人間は、オブジェクトが条件付けられた物理的知識に基づいて知覚、相互作用、お … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

Tiny Robotics Dataset and Benchmark for Continual Object Detection

要約 モバイルロボット工学のオブジェクトの検出は、自律的なナビゲーションから検査 … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

Human-in-the-loop Reasoning For Traffic Sign Detection: Collaborative Approach Yolo With Video-llava

要約 トラフィックサイン認識(TSR)検出は、自律車両の重要なコンポーネントです … 続きを読む

カテゴリー: cs.CV | コメントする

On the Utility of Equivariance and Symmetry Breaking in Deep Learning Architectures on Point Clouds

要約 このホワイトペーパーでは、さまざまな幾何学的複雑さのさまざまなタスクにわた … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | コメントする