-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Leveraging Bi-Focal Perspectives and Granular Feature Integration for Accurate Reliable Early Alzheimer’s Detection
要約 アルツハイマー病(AD)は最も一般的な神経変性であり、毎年何百万人もの患者 … 続きを読む
MC-NeRF: Multi-Camera Neural Radiance Fields for Multi-Camera Image Acquisition Systems
要約 Neural Radiance Fields (NeRF) は、3D シー … 続きを読む
カテゴリー: cs.CV
MC-NeRF: Multi-Camera Neural Radiance Fields for Multi-Camera Image Acquisition Systems はコメントを受け付けていません
The Silent Prompt: Initial Noise as Implicit Guidance for Goal-Driven Image Generation
要約 テキストから画像への合成 (T2I) は、大規模な普及モデルの出現により著 … 続きを読む
カテゴリー: cs.CV
The Silent Prompt: Initial Noise as Implicit Guidance for Goal-Driven Image Generation はコメントを受け付けていません
Scaling Efficient Masked Image Modeling on Large Remote Sensing Dataset
要約 マスク イメージ モデリング (MIM) は、リモート センシング (RS … 続きを読む
カテゴリー: cs.CV
Scaling Efficient Masked Image Modeling on Large Remote Sensing Dataset はコメントを受け付けていません
Probabilistic Language-Image Pre-Training
要約 視覚言語モデル (VLM) は、位置合わせされた画像とテキストのペアを結合 … 続きを読む
LUDVIG: Learning-free Uplifting of 2D Visual features to Gaussian Splatting scenes
要約 私たちは、DINO、SAM、CLIP などのビジョン基盤モデルの機能を 3 … 続きを読む
カテゴリー: cs.CV
LUDVIG: Learning-free Uplifting of 2D Visual features to Gaussian Splatting scenes はコメントを受け付けていません
How to Squeeze An Explanation Out of Your Model
要約 深層学習モデルは、さまざまなタスクを実行する際の信頼性により、現在広く使用 … 続きを読む
LoRA.rar: Learning to Merge LoRAs via Hypernetworks for Subject-Style Conditioned Image Generation
要約 画像生成モデルの最近の進歩により、ユーザー定義の主題 (コンテンツ) とス … 続きを読む
Fine-Tuning CLIP’s Last Visual Projector: A Few-Shot Cornucopia
要約 CLIP (Radford et al., 2021) のような対照的に事 … 続きを読む
カテゴリー: cs.CV
Fine-Tuning CLIP’s Last Visual Projector: A Few-Shot Cornucopia はコメントを受け付けていません
BIAS: A Body-based Interpretable Active Speaker Approach
要約 最先端のアクティブ スピーカー検出 (ASD) アプローチは、音声と顔の特 … 続きを読む
カテゴリー: cs.CV
BIAS: A Body-based Interpretable Active Speaker Approach はコメントを受け付けていません