-
最近の投稿
- Exploiting Chordal Sparsity for Fast Global Optimality with Application to Localization
- A Mixed-Integer Conic Program for the Moving-Target Traveling Salesman Problem based on a Graph of Convex Sets
- Autonomous Electrochemistry Platform with Real-Time Normality Testing of Voltammetry Measurements Using ML
- Testing Human-Hand Segmentation on In-Distribution and Out-of-Distribution Data in Human-Robot Interactions Using a Deep Ensemble Model
- Tactile-based Exploration, Mapping and Navigation with Collision-Resilient Aerial Vehicles
-
最近のコメント
表示できるコメントはありません。 cs.AI (32244) cs.CL (24383) cs.CR (2504) cs.CV (38486) cs.LG (37123) cs.RO (18822) cs.SY (2876) eess.IV (4618) eess.SY (2870) stat.ML (4903)
投稿者「jarxiv」のアーカイブ
Go-with-the-Flow: Motion-Controllable Video Diffusion Models Using Real-Time Warped Noise
要約 生成モデリングは、ランダム ノイズを構造化された出力に変換することを目的と … 続きを読む
MangaNinja: Line Art Colorization with Precise Reference Following
要約 拡散モデルから派生した MangaNinjia は、リファレンスに基づいた … 続きを読む
DAViD: Modeling Dynamic Affordance of 3D Objects using Pre-trained Video Diffusion Models
要約 AI が日常生活を改善するには、人間の物体使用能力を理解することが不可欠で … 続きを読む
Vid2Sim: Realistic and Interactive Simulation from Video for Urban Navigation
要約 シミュレーションと現実のギャップは、シミュレーションにおけるロボット学習に … 続きを読む
WebWalker: Benchmarking LLMs in Web Traversal
要約 検索拡張生成 (RAG) は、オープンドメインの質問応答におけるタスク全体 … 続きを読む
Rethinking Decoders for Transformer-based Semantic Segmentation: A Compression Perspective
要約 Transformer ベースのセマンティック セグメンテーションの最先端 … 続きを読む
Cost-Effective Robotic Handwriting System with AI Integration
要約 この論文では、人間のような手書きを高精度で再現するように設計された、コスト … 続きを読む
GazeGrasp: DNN-Driven Robotic Grasping with Wearable Eye-Gaze Interface
要約 我々は、運動障害を持つ個人が視線を使用して協働ロボットを制御できるようにす … 続きを読む
Synthesis and Analysis of Data as Probability Measures with Entropy-Regularized Optimal Transport
要約 エントロピー正則化された Wasserstein-2 コストとその不偏バー … 続きを読む
BIOMEDICA: An Open Biomedical Image-Caption Archive, Dataset, and Vision-Language Models Derived from Scientific Literature
要約 ビジョン言語モデル (VLM) の開発は、大規模で多様なマルチモーダル デ … 続きを読む