投稿者「jarxiv」のアーカイブ

Learning an Actionable Discrete Diffusion Policy via Large-Scale Actionless Video Pre-Training

要約 複数のタスクをこなすジェネラリストな具現化エージェントの学習には、主にアク … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | コメントする

SuperGS: Super-Resolution 3D Gaussian Splatting via Latent Feature Field and Gradient-guided Splitting

要約 近年、3Dガウス散布法(3DGS)は、そのリアルタイムレンダリング機能と優 … 続きを読む

カテゴリー: cs.CV | コメントする

Combining Pre- and Post-Demosaicking Noise Removal for RAW Video

要約 ノイズ除去は、カメラセンサーによって取り込まれたデータを表示可能な画像やビ … 続きを読む

カテゴリー: cs.CV, eess.IV, I.4 | コメントする

An Improved Variational Method for Image Denoising

要約 全変動(TV)法は、画像の全変動を最小化することによってノイズを低減するこ … 続きを読む

カテゴリー: cs.CV, cs.NA, math.NA | コメントする

IC3M: In-Car Multimodal Multi-object Monitoring for Abnormal Status of Both Driver and Passengers

要約 近年、車載モニタリングは、ドライバーの異常状態を早期に検知し、交通事故を未 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.SY, eess.SY | コメントする

High-Efficiency Neural Video Compression via Hierarchical Predictive Learning

要約 強化されたDeep Hierarchical Video Compress … 続きを読む

カテゴリー: cs.CV, eess.IV | コメントする

BinaryDM: Accurate Weight Binarization for Efficient Diffusion Models

要約 拡散モデル(DM)の高度化と計算量の大幅な増加に伴い、コンパクトで効率的な … 続きを読む

カテゴリー: cs.CV | コメントする

NL-Eye: Abductive NLI for Images

要約 視覚言語モデル(VLM)ベースのボットは、床が濡れていることを検知したら、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | コメントする

Qwen2-VL: Enhancing Vision-Language Model’s Perception of the World at Any Resolution

要約 Qwen2-VLは、従来のQwen-VLをさらに進化させたモデルであり、従 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | コメントする

GI-GS: Global Illumination Decomposition on Gaussian Splatting for Inverse Rendering

要約 GI-GSは、3Dガウス・スプラッティング(3DGS)とディファード・シェ … 続きを読む

カテゴリー: cs.CV | コメントする