-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年5月
SD-NAE: Generating Natural Adversarial Examples with Stable Diffusion
要約 Natural Adversarial Examples (NAE) は、 … 続きを読む
カテゴリー: cs.CV
SD-NAE: Generating Natural Adversarial Examples with Stable Diffusion はコメントを受け付けていません
Farm3D: Learning Articulated 3D Animals by Distilling 2D Diffusion
要約 我々は、事前にトレーニングされた 2D 拡散ベースの画像ジェネレーターから … 続きを読む
カテゴリー: cs.CV
Farm3D: Learning Articulated 3D Animals by Distilling 2D Diffusion はコメントを受け付けていません
ConsistencyDet: A Robust Object Detector with a Denoising Paradigm of Consistency Model
要約 知覚コンピューティングの分野における典型的なタスクであるオブジェクト検出は … 続きを読む
カテゴリー: cs.CV
ConsistencyDet: A Robust Object Detector with a Denoising Paradigm of Consistency Model はコメントを受け付けていません
Promoting AI Equity in Science: Generalized Domain Prompt Learning for Accessible VLM Research
要約 大規模視覚言語モデル (VLM) は、自然視覚タスクにおいて優れたパフォー … 続きを読む
EndoDAC: Efficient Adapting Foundation Model for Self-Supervised Depth Estimation from Any Endoscopic Camera
要約 深さの推定は、ナビゲーション、表面再構築、拡張現実の視覚化など、内視鏡手術 … 続きを読む
Achieving Fairness Through Channel Pruning for Dermatological Disease Diagnosis
要約 多くの研究により、深層学習ベースの医療画像分類モデルは、人種、性別、年齢な … 続きを読む
VimTS: A Unified Video and Image Text Spotter for Enhancing the Cross-domain Generalization
要約 画像またはビデオシーケンスからテキスト情報を抽出するタスクであるテキストス … 続きを読む
Splat-MOVER: Multi-Stage, Open-Vocabulary Robotic Manipulation via Editable Gaussian Splatting
要約 我々は、オープンボキャブラリーのロボット操作のためのモジュール型ロボットス … 続きを読む
The impact of Compositionality in Zero-shot Multi-label action recognition for Object-based tasks
要約 ビデオにおけるマルチラベルのアクション認識に対処することは、動的な環境にお … 続きを読む
View-Centric Multi-Object Tracking with Homographic Matching in Moving UAV
要約 このペーパーでは、無人航空機 (UAV) の移動シナリオにおける複数オブジ … 続きを読む
カテゴリー: cs.CV
View-Centric Multi-Object Tracking with Homographic Matching in Moving UAV はコメントを受け付けていません