cs.CV」カテゴリーアーカイブ

Dereflection Any Image with Diffusion Priors and Diversified Data

要約 ターゲットシーンと不要な反射の間の複雑な絡み合いにより、単一の画像の反射除 … 続きを読む

カテゴリー: cs.CV | Dereflection Any Image with Diffusion Priors and Diversified Data はコメントを受け付けていません

Adapting to the Unknown: Training-Free Audio-Visual Event Perception with Dynamic Thresholds

要約 異なるモダリティ(オーディオとビジュアル)にわたるイベントの時間的ローカリ … 続きを読む

カテゴリー: cs.CV | Adapting to the Unknown: Training-Free Audio-Visual Event Perception with Dynamic Thresholds はコメントを受け付けていません

Beyond Semantics: Rediscovering Spatial Awareness in Vision-Language Models

要約 ビジョン言語モデル(VLM)は、オブジェクトの識別と記述に優れていますが、 … 続きを読む

カテゴリー: cs.CV | Beyond Semantics: Rediscovering Spatial Awareness in Vision-Language Models はコメントを受け付けていません

Decouple and Track: Benchmarking and Improving Video Diffusion Transformers for Motion Transfer

要約 モーション転送タスクでは、ソースビデオから新しく生成されたビデオにモーショ … 続きを読む

カテゴリー: cs.CV | Decouple and Track: Benchmarking and Improving Video Diffusion Transformers for Motion Transfer はコメントを受け付けていません

Time-Series U-Net with Recurrence for Noise-Robust Imaging Photoplethysmography

要約 バイタルサインのリモート推定により、コンタクトベースのデバイスが利用できな … 続きを読む

カテゴリー: cs.CV | Time-Series U-Net with Recurrence for Noise-Robust Imaging Photoplethysmography はコメントを受け付けていません

OpenVLThinker: An Early Exploration to Complex Vision-Language Reasoning via Iterative Self-Improvement

要約 Deepseek-R1によって実証された最近の進歩は、自己検証や自己修正な … 続きを読む

カテゴリー: cs.CL, cs.CV | OpenVLThinker: An Early Exploration to Complex Vision-Language Reasoning via Iterative Self-Improvement はコメントを受け付けていません

TopoDiffusionNet: A Topology-aware Diffusion Model

要約 拡散モデルは、視覚的に印象的な画像の作成に優れていますが、指定されたトポロ … 続きを読む

カテゴリー: cs.CV | TopoDiffusionNet: A Topology-aware Diffusion Model はコメントを受け付けていません

Image as an IMU: Estimating Camera Motion from a Single Motion-Blurred Image

要約 多くのロボット工学およびVR/ARアプリケーションでは、カメラの動きが高速 … 続きを読む

カテゴリー: cs.CV | Image as an IMU: Estimating Camera Motion from a Single Motion-Blurred Image はコメントを受け付けていません

Position: Interactive Generative Video as Next-Generation Game Engine

要約 現代のゲーム開発は、従来のゲームエンジンの所定のコンテンツにより、創造性と … 続きを読む

カテゴリー: cs.CV | Position: Interactive Generative Video as Next-Generation Game Engine はコメントを受け付けていません

URLOST: Unsupervised Representation Learning without Stationarity or Topology

要約 監視されていない表現学習は、大きな進歩を遂げています。 ただし、ドメイン固 … 続きを読む

カテゴリー: cs.CV, cs.LG | URLOST: Unsupervised Representation Learning without Stationarity or Topology はコメントを受け付けていません