-
最近の投稿
- Multimodal Active Measurement for Human Mesh Recovery in Close Proximity
- An Algorithm for Distributed Computation of Reachable Sets for Multi-Agent Systems
- Meta-Learning Augmented MPC for Disturbance-Aware Motion Planning and Control of Quadrotors
- Solving Multi-Goal Robotic Tasks with Decision Transformer
- Context-Aware Command Understanding for Tabletop Scenarios
-
最近のコメント
表示できるコメントはありません。 cs.AI (27848) cs.CL (21045) cs.CR (2180) cs.CV (34554) cs.LG (32592) cs.RO (15968) cs.SY (2478) eess.IV (4238) eess.SY (2472) stat.ML (4364)
投稿者「jarxiv」のアーカイブ
NL-Eye: Abductive NLI for Images
要約 視覚言語モデル(VLM)ベースのボットは、床が濡れていることを検知したら、 … 続きを読む
Qwen2-VL: Enhancing Vision-Language Model’s Perception of the World at Any Resolution
要約 Qwen2-VLは、従来のQwen-VLをさらに進化させたモデルであり、従 … 続きを読む
GI-GS: Global Illumination Decomposition on Gaussian Splatting for Inverse Rendering
要約 GI-GSは、3Dガウス・スプラッティング(3DGS)とディファード・シェ … 続きを読む
Metrics Revolutions: Groundbreaking Insights into the Implementation of Metrics for Biomedical Image Segmentation
要約 セグメンテーション性能の評価は、バイオメディカル画像解析における一般的なタ … 続きを読む
Spatial-Temporal Multi-Cuts for Online Multiple-Camera Vehicle Tracking
要約 正確なオンライン複数カメラ車両追跡は、インテリジェント交通システム、自律走 … 続きを読む
Diffusion-based Extreme Image Compression with Compressed Feature Initialization
要約 拡散に基づく極端な画像圧縮法は、極めて低いビットレートで印象的な性能を達成 … 続きを読む
Context and Geometry Aware Voxel Transformer for Semantic Scene Completion
要約 視覚に基づく意味的情景補完(Semantic Scene Completi … 続きを読む
Why Sample Space Matters: Keyframe Sampling Optimization for LiDAR-based Place Recognition
要約 近年のロボット工学の進歩により、ロボットが長期的かつ大規模なミッションを遂 … 続きを読む
Learning 3D Perception from Others’ Predictions
要約 実世界環境における正確な3D物体検出には、高品質で膨大な量のアノテーション … 続きを読む
Measuring and Improving Persuasiveness of Generative Models
要約 LLMは、人間が消費するコンテンツを生成するワークフロー(マーケティングな … 続きを読む