投稿者「jarxiv」のアーカイブ

BinaryDM: Accurate Weight Binarization for Efficient Diffusion Models

要約 拡散モデル(DM)の高度化と計算量の大幅な増加に伴い、コンパクトで効率的な … 続きを読む

カテゴリー: cs.CV | コメントする

NL-Eye: Abductive NLI for Images

要約 視覚言語モデル(VLM)ベースのボットは、床が濡れていることを検知したら、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | コメントする

Qwen2-VL: Enhancing Vision-Language Model’s Perception of the World at Any Resolution

要約 Qwen2-VLは、従来のQwen-VLをさらに進化させたモデルであり、従 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | コメントする

GI-GS: Global Illumination Decomposition on Gaussian Splatting for Inverse Rendering

要約 GI-GSは、3Dガウス・スプラッティング(3DGS)とディファード・シェ … 続きを読む

カテゴリー: cs.CV | コメントする

Metrics Revolutions: Groundbreaking Insights into the Implementation of Metrics for Biomedical Image Segmentation

要約 セグメンテーション性能の評価は、バイオメディカル画像解析における一般的なタ … 続きを読む

カテゴリー: cs.CV | コメントする

Spatial-Temporal Multi-Cuts for Online Multiple-Camera Vehicle Tracking

要約 正確なオンライン複数カメラ車両追跡は、インテリジェント交通システム、自律走 … 続きを読む

カテゴリー: cs.CV | コメントする

Diffusion-based Extreme Image Compression with Compressed Feature Initialization

要約 拡散に基づく極端な画像圧縮法は、極めて低いビットレートで印象的な性能を達成 … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする

Context and Geometry Aware Voxel Transformer for Semantic Scene Completion

要約 視覚に基づく意味的情景補完(Semantic Scene Completi … 続きを読む

カテゴリー: cs.CV | コメントする

Why Sample Space Matters: Keyframe Sampling Optimization for LiDAR-based Place Recognition

要約 近年のロボット工学の進歩により、ロボットが長期的かつ大規模なミッションを遂 … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

Learning 3D Perception from Others’ Predictions

要約 実世界環境における正確な3D物体検出には、高品質で膨大な量のアノテーション … 続きを読む

カテゴリー: cs.CV | コメントする