-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Navigating Motion Agents in Dynamic and Cluttered Environments through LLM Reasoning
要約 このペーパーは、動的および乱雑な環境での自律的なナビゲーションに向けて大規 … 続きを読む
Synthetic Dataset Generation for Autonomous Mobile Robots Using 3D Gaussian Splatting for Vision Training
要約 注釈付きのデータセットは、オブジェクトの検出のためにニューラルネットワーク … 続きを読む
SR3D: Unleashing Single-view 3D Reconstruction for Transparent and Specular Object Grasping
要約 3Dロボット操作の最近の進歩により、日常のオブジェクトの把握が改善されまし … 続きを読む
CIVET: Systematic Evaluation of Understanding in VLMs
要約 ビジョン言語モデル(VLM)はさまざまなタスクで競争力のあるパフォーマンス … 続きを読む
AnyTop: Character Animation Diffusion with Any Topology
要約 任意のスケルトンの動きを生成することは、コンピューターグラフィックスの長年 … 続きを読む
Detection-Driven Object Count Optimization for Text-to-Image Diffusion Models
要約 テキストから画像の生成におけるオブジェクト数を正確に制御することは、依然と … 続きを読む
Single GPU Task Adaptation of Pathology Foundation Models for Whole Slide Image Analysis
要約 Pathology Foundationモデル(PFM)は、スライド画像全 … 続きを読む
カテゴリー: cs.CV
Single GPU Task Adaptation of Pathology Foundation Models for Whole Slide Image Analysis はコメントを受け付けていません
MokA: Multimodal Low-Rank Adaptation for MLLMs
要約 この論文では、現在の最新のマルチモーダル微調整方法が主要な制限によって妨げ … 続きを読む
カテゴリー: cs.CV
MokA: Multimodal Low-Rank Adaptation for MLLMs はコメントを受け付けていません
Vision-Based Autonomous MM-Wave Reflector Using ArUco-Driven Angle-of-Arrival Estimation
要約 非表示(NLOS)条件における信頼できるミリ波(MMWAVE)コミュニケー … 続きを読む
カテゴリー: cs.CV
Vision-Based Autonomous MM-Wave Reflector Using ArUco-Driven Angle-of-Arrival Estimation はコメントを受け付けていません
Quantifying Cross-Modality Memorization in Vision-Language Models
要約 トレーニング中にニューラルネットワークがどのように、どのように覚えているか … 続きを読む