-
最近の投稿
- KISS-Matcher: Fast and Robust Point Cloud Registration Revisited
- Unpacking Failure Modes of Generative Policies: Runtime Monitoring of Consistency and Progress
- Mode-GS: Monocular Depth Guided Anchored 3D Gaussian Splatting for Robust Ground-View Scene Rendering
- A Universal Formulation for Path-Parametric Planning and Control
- Next Best Sense: Guiding Vision and Touch with FisherRF for 3D Gaussian Splatting
-
最近のコメント
表示できるコメントはありません。 cs.AI (27775) cs.CL (20990) cs.CR (2176) cs.CV (34489) cs.LG (32518) cs.RO (15916) cs.SY (2472) eess.IV (4231) eess.SY (2466) stat.ML (4356)
投稿者「jarxiv」のアーカイブ
NL-Eye: Abductive NLI for Images
要約 視覚言語モデル(VLM)ベースのボットは、床が濡れていることを検知したら、 … 続きを読む
Qwen2-VL: Enhancing Vision-Language Model’s Perception of the World at Any Resolution
要約 Qwen2-VLは、従来のQwen-VLをさらに進化させたモデルであり、従 … 続きを読む
GI-GS: Global Illumination Decomposition on Gaussian Splatting for Inverse Rendering
要約 GI-GSは、3Dガウス・スプラッティング(3DGS)とディファード・シェ … 続きを読む
Metrics Revolutions: Groundbreaking Insights into the Implementation of Metrics for Biomedical Image Segmentation
要約 セグメンテーション性能の評価は、バイオメディカル画像解析における一般的なタ … 続きを読む
Spatial-Temporal Multi-Cuts for Online Multiple-Camera Vehicle Tracking
要約 正確なオンライン複数カメラ車両追跡は、インテリジェント交通システム、自律走 … 続きを読む
Diffusion-based Extreme Image Compression with Compressed Feature Initialization
要約 拡散に基づく極端な画像圧縮法は、極めて低いビットレートで印象的な性能を達成 … 続きを読む
Context and Geometry Aware Voxel Transformer for Semantic Scene Completion
要約 視覚に基づく意味的情景補完(Semantic Scene Completi … 続きを読む
Why Sample Space Matters: Keyframe Sampling Optimization for LiDAR-based Place Recognition
要約 近年のロボット工学の進歩により、ロボットが長期的かつ大規模なミッションを遂 … 続きを読む
Learning 3D Perception from Others’ Predictions
要約 実世界環境における正確な3D物体検出には、高品質で膨大な量のアノテーション … 続きを読む
Measuring and Improving Persuasiveness of Generative Models
要約 LLMは、人間が消費するコンテンツを生成するワークフロー(マーケティングな … 続きを読む