-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年3月
Vamba: Understanding Hour-Long Videos with Hybrid Mamba-Transformers
要約 最先端の変圧器ベースの大規模マルチモーダルモデル(LMMS)は、因果的自己 … 続きを読む
カテゴリー: cs.CV
Vamba: Understanding Hour-Long Videos with Hybrid Mamba-Transformers はコメントを受け付けていません
Towards Few-Call Model Stealing via Active Self-Paced Knowledge Distillation and Diffusion-Based Image Generation
要約 拡散モデルは、画像合成の強力な機能を示しており、多くのコンピュータービジョ … 続きを読む
Pathology Image Compression with Pre-trained Autoencoders
要約 デジタル組織病理学の高解像度全体のスライド画像の量が増えているため、重要な … 続きを読む
Advancing 3D Gaussian Splatting Editing with Complementary and Consensus Information
要約 We present a novel framework for enha … 続きを読む
カテゴリー: cs.CV
Advancing 3D Gaussian Splatting Editing with Complementary and Consensus Information はコメントを受け付けていません
Rethinking Few-Shot Adaptation of Vision-Language Models in Two Stages
要約 An old-school recipe for training a c … 続きを読む
TreeMeshGPT: Artistic Mesh Generation with Autoregressive Tree Sequencing
要約 Treemeshgptを紹介します。Treemeshgptは、入力ポイント … 続きを読む
Seeing and Seeing Through the Glass: Real and Synthetic Data for Multi-Layer Depth Estimation
要約 透明なオブジェクトは日常生活で一般的であり、透明な表面とその背後にあるオブ … 続きを読む
カテゴリー: cs.CV
Seeing and Seeing Through the Glass: Real and Synthetic Data for Multi-Layer Depth Estimation はコメントを受け付けていません
Filter, Correlate, Compress: Training-Free Token Reduction for MLLM Acceleration
要約 シーケンスの長さに関するマルチモーダル大手言語モデル(MLLM)の2次複雑 … 続きを読む
カテゴリー: cs.CV
Filter, Correlate, Compress: Training-Free Token Reduction for MLLM Acceleration はコメントを受け付けていません
ReCamMaster: Camera-Controlled Generative Rendering from A Single Video
要約 カメラ制御は、テキストまたは画像条件付けられたビデオ生成タスクで積極的に研 … 続きを読む
カテゴリー: cs.CV
ReCamMaster: Camera-Controlled Generative Rendering from A Single Video はコメントを受け付けていません