-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Dereflection Any Image with Diffusion Priors and Diversified Data
要約 ターゲットシーンと不要な反射の間の複雑な絡み合いにより、単一の画像の反射除 … 続きを読む
カテゴリー: cs.CV
Dereflection Any Image with Diffusion Priors and Diversified Data はコメントを受け付けていません
Adapting to the Unknown: Training-Free Audio-Visual Event Perception with Dynamic Thresholds
要約 異なるモダリティ(オーディオとビジュアル)にわたるイベントの時間的ローカリ … 続きを読む
カテゴリー: cs.CV
Adapting to the Unknown: Training-Free Audio-Visual Event Perception with Dynamic Thresholds はコメントを受け付けていません
Beyond Semantics: Rediscovering Spatial Awareness in Vision-Language Models
要約 ビジョン言語モデル(VLM)は、オブジェクトの識別と記述に優れていますが、 … 続きを読む
カテゴリー: cs.CV
Beyond Semantics: Rediscovering Spatial Awareness in Vision-Language Models はコメントを受け付けていません
Decouple and Track: Benchmarking and Improving Video Diffusion Transformers for Motion Transfer
要約 モーション転送タスクでは、ソースビデオから新しく生成されたビデオにモーショ … 続きを読む
カテゴリー: cs.CV
Decouple and Track: Benchmarking and Improving Video Diffusion Transformers for Motion Transfer はコメントを受け付けていません
Time-Series U-Net with Recurrence for Noise-Robust Imaging Photoplethysmography
要約 バイタルサインのリモート推定により、コンタクトベースのデバイスが利用できな … 続きを読む
カテゴリー: cs.CV
Time-Series U-Net with Recurrence for Noise-Robust Imaging Photoplethysmography はコメントを受け付けていません
OpenVLThinker: An Early Exploration to Complex Vision-Language Reasoning via Iterative Self-Improvement
要約 Deepseek-R1によって実証された最近の進歩は、自己検証や自己修正な … 続きを読む
TopoDiffusionNet: A Topology-aware Diffusion Model
要約 拡散モデルは、視覚的に印象的な画像の作成に優れていますが、指定されたトポロ … 続きを読む
カテゴリー: cs.CV
TopoDiffusionNet: A Topology-aware Diffusion Model はコメントを受け付けていません
Image as an IMU: Estimating Camera Motion from a Single Motion-Blurred Image
要約 多くのロボット工学およびVR/ARアプリケーションでは、カメラの動きが高速 … 続きを読む
カテゴリー: cs.CV
Image as an IMU: Estimating Camera Motion from a Single Motion-Blurred Image はコメントを受け付けていません
Position: Interactive Generative Video as Next-Generation Game Engine
要約 現代のゲーム開発は、従来のゲームエンジンの所定のコンテンツにより、創造性と … 続きを読む
カテゴリー: cs.CV
Position: Interactive Generative Video as Next-Generation Game Engine はコメントを受け付けていません
URLOST: Unsupervised Representation Learning without Stationarity or Topology
要約 監視されていない表現学習は、大きな進歩を遂げています。 ただし、ドメイン固 … 続きを読む