月別アーカイブ: 2025年3月

Vamba: Understanding Hour-Long Videos with Hybrid Mamba-Transformers

要約 最先端の変圧器ベースの大規模マルチモーダルモデル(LMMS)は、因果的自己 … 続きを読む

カテゴリー: cs.CV | Vamba: Understanding Hour-Long Videos with Hybrid Mamba-Transformers はコメントを受け付けていません

Towards Few-Call Model Stealing via Active Self-Paced Knowledge Distillation and Diffusion-Based Image Generation

要約 拡散モデルは、画像合成の強力な機能を示しており、多くのコンピュータービジョ … 続きを読む

カテゴリー: cs.CV, cs.LG | Towards Few-Call Model Stealing via Active Self-Paced Knowledge Distillation and Diffusion-Based Image Generation はコメントを受け付けていません

Pathology Image Compression with Pre-trained Autoencoders

要約 デジタル組織病理学の高解像度全体のスライド画像の量が増えているため、重要な … 続きを読む

カテゴリー: cs.CV, eess.IV | Pathology Image Compression with Pre-trained Autoencoders はコメントを受け付けていません

Advancing 3D Gaussian Splatting Editing with Complementary and Consensus Information

要約 We present a novel framework for enha … 続きを読む

カテゴリー: cs.CV | Advancing 3D Gaussian Splatting Editing with Complementary and Consensus Information はコメントを受け付けていません

Rethinking Few-Shot Adaptation of Vision-Language Models in Two Stages

要約 An old-school recipe for training a c … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM | Rethinking Few-Shot Adaptation of Vision-Language Models in Two Stages はコメントを受け付けていません

TreeMeshGPT: Artistic Mesh Generation with Autoregressive Tree Sequencing

要約 Treemeshgptを紹介します。Treemeshgptは、入力ポイント … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.MM | TreeMeshGPT: Artistic Mesh Generation with Autoregressive Tree Sequencing はコメントを受け付けていません

Seeing and Seeing Through the Glass: Real and Synthetic Data for Multi-Layer Depth Estimation

要約 透明なオブジェクトは日常生活で一般的であり、透明な表面とその背後にあるオブ … 続きを読む

カテゴリー: cs.CV | Seeing and Seeing Through the Glass: Real and Synthetic Data for Multi-Layer Depth Estimation はコメントを受け付けていません

Filter, Correlate, Compress: Training-Free Token Reduction for MLLM Acceleration

要約 シーケンスの長さに関するマルチモーダル大手言語モデル(MLLM)の2次複雑 … 続きを読む

カテゴリー: cs.CV | Filter, Correlate, Compress: Training-Free Token Reduction for MLLM Acceleration はコメントを受け付けていません

ReCamMaster: Camera-Controlled Generative Rendering from A Single Video

要約 カメラ制御は、テキストまたは画像条件付けられたビデオ生成タスクで積極的に研 … 続きを読む

カテゴリー: cs.CV | ReCamMaster: Camera-Controlled Generative Rendering from A Single Video はコメントを受け付けていません

Centaur: Robust End-to-End Autonomous Driving with Test-Time Training

要約 展開中にエンドツーエンドの自動運転車の複雑な意思決定システムにどのように依 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Centaur: Robust End-to-End Autonomous Driving with Test-Time Training はコメントを受け付けていません