-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
LoTLIP: Improving Language-Image Pre-training for Long Text Understanding
要約 長いテキストを理解することは実際には大きな要求ですが、ほとんどの言語画像事 … 続きを読む
カテゴリー: cs.CV
LoTLIP: Improving Language-Image Pre-training for Long Text Understanding はコメントを受け付けていません
Beyond FVD: Enhanced Evaluation Metrics for Video Generation Quality
要約 Fr\’echet Video Distance (FVD) … 続きを読む
MIBench: A Comprehensive Benchmark for Model Inversion Attack and Defense
要約 モデル反転 (MI) 攻撃は、ターゲット モデルの出力情報を利用してプライ … 続きを読む
3D-free meets 3D priors: Novel View Synthesis from a Single Image with Pretrained Diffusion Guidance
要約 最近の 3D ノベル ビュー合成 (NVS) 手法は、単一オブジェクト中心 … 続きを読む
カテゴリー: cs.CV
3D-free meets 3D priors: Novel View Synthesis from a Single Image with Pretrained Diffusion Guidance はコメントを受け付けていません
TuneVLSeg: Prompt Tuning Benchmark for Vision-Language Segmentation Models
要約 視覚言語モデル (VLM) は、視覚タスクにおいて優れたパフォーマンスを示 … 続きを読む
Control-oriented Clustering of Visual Latent Representation
要約 私たちは、動作のクローン作成から学習した画像ベースの制御パイプラインにおけ … 続きを読む
KISS-Matcher: Fast and Robust Point Cloud Registration Revisited
要約 グローバル点群登録システムはあらゆる面で大幅に進歩しましたが、多くの研究は … 続きを読む
Mode-GS: Monocular Depth Guided Anchored 3D Gaussian Splatting for Robust Ground-View Scene Rendering
要約 地上ロボットの軌道データセット用の新しいビュー レンダリング アルゴリズム … 続きを読む
Next Best Sense: Guiding Vision and Touch with FisherRF for 3D Gaussian Splatting
要約 3D ガウス スプラッティング (3DGS) を使用したロボット マニピュ … 続きを読む