-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年4月
Self-supervised Dataset Distillation: A Good Compression Is All You Need
要約 データセットの蒸留は、元のデータの情報の本質を最大限に保持しながら、大規模 … 続きを読む
Gaga: Group Any Gaussians via 3D-aware Memory Bank
要約 ゼロショット セグメンテーション モデルによって予測された一貫性のない 2 … 続きを読む
カテゴリー: cs.CV
Gaga: Group Any Gaussians via 3D-aware Memory Bank はコメントを受け付けていません
Two Effects, One Trigger: On the Modality Gap, Object Bias, and Information Imbalance in Contrastive Vision-Language Representation Learning
要約 CLIP のような対照的な視覚言語モデルは、さまざまな下流タスクで多用途に … 続きを読む
View Selection for 3D Captioning via Diffusion Ranking
要約 スケーラブルなアノテーション アプローチは、広範な 3D テキスト データ … 続きを読む
カテゴリー: cs.CV
View Selection for 3D Captioning via Diffusion Ranking はコメントを受け付けていません
WaveMo: Learning Wavefront Modulations to See Through Scattering
要約 散乱媒体を介したイメージングは、医療診断から天文学に至るまでの分野にお … 続きを読む
ControlNet++: Improving Conditional Controls with Efficient Consistency Feedback
要約 テキストから画像への拡散モデルの制御性を高めるために、ControlNet … 続きを読む
QuasiSim: Parameterized Quasi-Physical Simulators for Dexterous Manipulations Transfer
要約 私たちはシミュレータを設計することによって、器用な操作の伝達の問題を調査し … 続きを読む
Supervised Fine-tuning in turn Improves Visual Foundation Models
要約 近年、CLIP のような画像テキスト トレーニングが視覚基礎モデルの事前ト … 続きを読む
Any2Point: Empowering Any-modality Large Models for Efficient 3D Understanding
要約 最近、大規模な基礎モデルが注目を集めており、広範なシナリオで優れたパフォー … 続きを読む
OpenBias: Open-set Bias Detection in Text-to-Image Generative Models
要約 テキストから画像への生成モデルはますます人気が高まっており、一般の人々が利 … 続きを読む