投稿者「jarxiv」のアーカイブ

IC3M: In-Car Multimodal Multi-object Monitoring for Abnormal Status of Both Driver and Passengers

要約 近年、車載モニタリングは、ドライバーの異常状態を早期に検知し、交通事故を未 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.SY, eess.SY | コメントする

High-Efficiency Neural Video Compression via Hierarchical Predictive Learning

要約 強化されたDeep Hierarchical Video Compress … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする

BinaryDM: Accurate Weight Binarization for Efficient Diffusion Models

要約 拡散モデル(DM)の高度化と計算量の大幅な増加に伴い、コンパクトで効率的な … 続きを読む

カテゴリー: cs.CV | コメントする

NL-Eye: Abductive NLI for Images

要約 視覚言語モデル(VLM)ベースのボットは、床が濡れていることを検知したら、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | コメントする

Qwen2-VL: Enhancing Vision-Language Model’s Perception of the World at Any Resolution

要約 Qwen2-VLは、従来のQwen-VLをさらに進化させたモデルであり、従 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | コメントする

GI-GS: Global Illumination Decomposition on Gaussian Splatting for Inverse Rendering

要約 GI-GSは、3Dガウス・スプラッティング(3DGS)とディファード・シェ … 続きを読む

カテゴリー: cs.CV | コメントする

Metrics Revolutions: Groundbreaking Insights into the Implementation of Metrics for Biomedical Image Segmentation

要約 セグメンテーション性能の評価は、バイオメディカル画像解析における一般的なタ … 続きを読む

カテゴリー: cs.CV | コメントする

Spatial-Temporal Multi-Cuts for Online Multiple-Camera Vehicle Tracking

要約 正確なオンライン複数カメラ車両追跡は、インテリジェント交通システム、自律走 … 続きを読む

カテゴリー: cs.CV | コメントする

Diffusion-based Extreme Image Compression with Compressed Feature Initialization

要約 拡散に基づく極端な画像圧縮法は、極めて低いビットレートで印象的な性能を達成 … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする

Context and Geometry Aware Voxel Transformer for Semantic Scene Completion

要約 視覚に基づく意味的情景補完(Semantic Scene Completi … 続きを読む

カテゴリー: cs.CV | コメントする