-
最近の投稿
- Topological mapping for traversability-aware long-range navigation in off-road terrain
- Equality Constrained Diffusion for Direct Trajectory Optimization
- Learning-Based Autonomous Navigation, Benchmark Environments and Simulation Framework for Endovascular Interventions
- Language Supervised Human Action Recognition with Salient Fusion: Construction Worker Action Recognition as a Use Case
- Bi-Level Motion Imitation for Humanoid Robots
-
最近のコメント
表示できるコメントはありません。 cs.AI (27641) cs.CL (20879) cs.CR (2167) cs.CV (34375) cs.LG (32373) cs.RO (15816) cs.SY (2460) eess.IV (4221) eess.SY (2454) stat.ML (4339)
投稿者「jarxiv」のアーカイブ
Learning an Actionable Discrete Diffusion Policy via Large-Scale Actionless Video Pre-Training
要約 複数のタスクをこなすジェネラリストな具現化エージェントの学習には、主にアク … 続きを読む
SuperGS: Super-Resolution 3D Gaussian Splatting via Latent Feature Field and Gradient-guided Splitting
要約 近年、3Dガウス散布法(3DGS)は、そのリアルタイムレンダリング機能と優 … 続きを読む
Combining Pre- and Post-Demosaicking Noise Removal for RAW Video
要約 ノイズ除去は、カメラセンサーによって取り込まれたデータを表示可能な画像やビ … 続きを読む
An Improved Variational Method for Image Denoising
要約 全変動(TV)法は、画像の全変動を最小化することによってノイズを低減するこ … 続きを読む
IC3M: In-Car Multimodal Multi-object Monitoring for Abnormal Status of Both Driver and Passengers
要約 近年、車載モニタリングは、ドライバーの異常状態を早期に検知し、交通事故を未 … 続きを読む
High-Efficiency Neural Video Compression via Hierarchical Predictive Learning
要約 強化されたDeep Hierarchical Video Compress … 続きを読む
BinaryDM: Accurate Weight Binarization for Efficient Diffusion Models
要約 拡散モデル(DM)の高度化と計算量の大幅な増加に伴い、コンパクトで効率的な … 続きを読む
NL-Eye: Abductive NLI for Images
要約 視覚言語モデル(VLM)ベースのボットは、床が濡れていることを検知したら、 … 続きを読む
Qwen2-VL: Enhancing Vision-Language Model’s Perception of the World at Any Resolution
要約 Qwen2-VLは、従来のQwen-VLをさらに進化させたモデルであり、従 … 続きを読む
GI-GS: Global Illumination Decomposition on Gaussian Splatting for Inverse Rendering
要約 GI-GSは、3Dガウス・スプラッティング(3DGS)とディファード・シェ … 続きを読む