-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
SDFit: 3D Object Pose and Shape by Fitting a Morphable SDF to a Single Image
要約 単一の画像から3Dオブジェクトのポーズと形状を回復することは、挑戦的で非常 … 続きを読む
カテゴリー: cs.CV
SDFit: 3D Object Pose and Shape by Fitting a Morphable SDF to a Single Image はコメントを受け付けていません
MIBench: A Comprehensive Framework for Benchmarking Model Inversion Attack and Defense
要約 モデル反転(MI)攻撃は、ターゲットモデルの出力情報を活用してプライバシー … 続きを読む
TriDi: Trilateral Diffusion of 3D Humans, Objects, and Interactions
要約 3D Human-Object Interaction(HOI)のモデリン … 続きを読む
カテゴリー: cs.CV
TriDi: Trilateral Diffusion of 3D Humans, Objects, and Interactions はコメントを受け付けていません
Personalized Generative Low-light Image Denoising and Enhancement
要約 今日のスマートフォンカメラは驚くほど良い写真を生成することができますが、光 … 続きを読む
カテゴリー: cs.CV
Personalized Generative Low-light Image Denoising and Enhancement はコメントを受け付けていません
Look Inside for More: Internal Spatial Modality Perception for 3D Anomaly Detection
要約 3D異常検出は最近、コンピュータービジョンに大きな焦点となっています。 い … 続きを読む
MGNiceNet: Unified Monocular Geometric Scene Understanding
要約 単眼の幾何学的シーンの理解は、パノプティックセグメンテーションと自己監視の … 続きを読む
カテゴリー: cs.CV
MGNiceNet: Unified Monocular Geometric Scene Understanding はコメントを受け付けていません
Sparrow: Data-Efficient Video-LLM with Text-to-Image Augmentation
要約 近年、ビジョン理解ドメインにおけるマルチモーダル大手言語モデル(MLLM) … 続きを読む
NeAS: 3D Reconstruction from X-ray Images using Neural Attenuation Surface
要約 2次元(2D)X線画像からの3次元(3D)構造の再構築は、コンピューター断 … 続きを読む
V2Flow: Unifying Visual Tokenization and Large Language Model Vocabularies for Autoregressive Image Generation
要約 V2Flowを提案します。これは、高忠実度の再構成が可能な離散視覚トークン … 続きを読む
AthletePose3D: A Benchmark Dataset for 3D Human Pose Estimation and Kinematic Validation in Athletic Movements
要約 人間のポーズ推定は、スポーツ科学、リハビリテーション、および生体力学的研究 … 続きを読む
カテゴリー: cs.CV
AthletePose3D: A Benchmark Dataset for 3D Human Pose Estimation and Kinematic Validation in Athletic Movements はコメントを受け付けていません