-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
HF-Diff: High-Frequency Perceptual Loss and Distribution Matching for One-Step Diffusion-Based Image Super-Resolution
要約 最近の拡散ベースのシングルステップ超解像手法は、SinSR と比較して優れ … 続きを読む
Generating 3D-Consistent Videos from Unposed Internet Photos
要約 私たちは、撮影されていないインターネット写真からビデオを生成する問題に対処 … 続きを読む
カテゴリー: cs.CV
Generating 3D-Consistent Videos from Unposed Internet Photos はコメントを受け付けていません
Find Any Part in 3D
要約 私たちは、3D でのオープンワールド パーツ セグメンテーション、つまりテ … 続きを読む
カテゴリー: cs.CV
Find Any Part in 3D はコメントを受け付けていません
REDUCIO! Generating 1024$\times$1024 Video within 16 Seconds using Extremely Compressed Motion Latents
要約 商用ビデオ生成モデルは、現実的で忠実度の高い結果を示していますが、依然とし … 続きを読む
カテゴリー: cs.CV
REDUCIO! Generating 1024$\times$1024 Video within 16 Seconds using Extremely Compressed Motion Latents はコメントを受け付けていません
AI-generated Image Detection: Passive or Watermark?
要約 テキストから画像へのモデルには多くの利点がありますが、重大な社会的リスクも … 続きを読む
MMTryon: Multi-Modal Multi-Reference Control for High-Quality Fashion Generation
要約 この文書では、テキスト指示と複数の衣服画像を入力として受け取ることにより、 … 続きを読む
カテゴリー: cs.CV
MMTryon: Multi-Modal Multi-Reference Control for High-Quality Fashion Generation はコメントを受け付けていません
M3D: Dual-Stream Selective State Spaces and Depth-Driven Framework for High-Fidelity Single-View 3D Reconstruction
要約 複雑なシーンで 1 つの RGB 画像から 3D オブジェクトを正確に再構 … 続きを読む
Topological Symmetry Enhanced Graph Convolution for Skeleton-Based Action Recognition
要約 スケルトンベースのアクション認識は、グラフ畳み込みネットワーク (GCN) … 続きを読む
LiDAR-BEVMTN: Real-Time LiDAR Bird’s-Eye View Multi-Task Perception Network for Autonomous Driving
要約 LiDAR は、自動運転における堅牢な 3D シーン認識に不可欠です。 L … 続きを読む
AsynEIO: Asynchronous Monocular Event-Inertial Odometry Using Gaussian Process Regression
要約 イベント カメラを慣性センサーと組み合わせると、高速操縦や低照度環境などの … 続きを読む