-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Computational Trichromacy Reconstruction: Empowering the Color-Vision Deficient to Recognize Colors Using Augmented Reality
要約 私たちは、色覚異常 (CVD) を持つ人々が色の認識/名前付けを支援する支 … 続きを読む
WaSt-3D: Wasserstein-2 Distance for Scene-to-Scene Stylization on 3D Gaussians
要約 スタイル転送技術は 2D 画像の様式化のために十分に開発されていますが、こ … 続きを読む
カテゴリー: cs.CV
WaSt-3D: Wasserstein-2 Distance for Scene-to-Scene Stylization on 3D Gaussians はコメントを受け付けていません
Resolving Multi-Condition Confusion for Finetuning-Free Personalized Image Generation
要約 パーソナライズされたテキストから画像への生成方法は、参照画像に基づいてカス … 続きを読む
カテゴリー: cs.CV
Resolving Multi-Condition Confusion for Finetuning-Free Personalized Image Generation はコメントを受け付けていません
Neural Light Spheres for Implicit Image Stitching and View Synthesis
要約 パノラマは、キャプチャするのが難しく、携帯電話の画面に表示するのが難しいた … 続きを読む
カテゴリー: cs.CV
Neural Light Spheres for Implicit Image Stitching and View Synthesis はコメントを受け付けていません
CollaMamba: Efficient Collaborative Perception with Cross-Agent Spatial-Temporal State Space Model
要約 相補的な知覚情報を共有することにより、複数のエージェントが協力して知覚する … 続きを読む
Manydepth2: Motion-Aware Self-Supervised Monocular Depth Estimation in Dynamic Scenes
要約 自己監視型単眼奥行き推定の進歩にもかかわらず、静的な世界についての仮定に依 … 続きを読む
カテゴリー: cs.CV
Manydepth2: Motion-Aware Self-Supervised Monocular Depth Estimation in Dynamic Scenes はコメントを受け付けていません
Perturb, Attend, Detect and Localize (PADL): Robust Proactive Image Defense
要約 画像操作の検出と位置特定は、生成モデル (GM) の普及により、研究コミュ … 続きを読む
カテゴリー: cs.CV
Perturb, Attend, Detect and Localize (PADL): Robust Proactive Image Defense はコメントを受け付けていません
Spatial Hierarchy and Temporal Attention Guided Cross Masking for Self-supervised Skeleton-based Action Recognition
要約 自己教師ありスケルトンベースのアクション認識では、効果的なマスキングを通じ … 続きを読む
カテゴリー: cs.CV
Spatial Hierarchy and Temporal Attention Guided Cross Masking for Self-supervised Skeleton-based Action Recognition はコメントを受け付けていません
The Hard Positive Truth about Vision-Language Compositionality
要約 いくつかのベンチマークは、私たちの最良のビジョン言語モデル (CLIP な … 続きを読む
Jumping through Local Minima: Quantization in the Loss Landscape of Vision Transformers
要約 量子化スケールとビット幅は、ニューラル ネットワークの量子化方法を検討する … 続きを読む
カテゴリー: cs.CV
Jumping through Local Minima: Quantization in the Loss Landscape of Vision Transformers はコメントを受け付けていません