-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Gaussian Mixture Flow Matching Models
要約 Diffusion models approximate the deno … 続きを読む
URECA: Unique Region Caption Anything
要約 Region-level captioning aims to gener … 続きを読む
CREA: A Collaborative Multi-Agent Framework for Creative Content Generation with Diffusion Models
要約 AIイメージの創造性は依然として基本的な課題であり、視覚的に説得力のあるコ … 続きを読む
カテゴリー: cs.CV
CREA: A Collaborative Multi-Agent Framework for Creative Content Generation with Diffusion Models はコメントを受け付けていません
Explain with Visual Keypoints Like a Real Mentor! A Benchmark for Multimodal Solution Explanation
要約 大規模な言語モデル(LLMS)における数学的推論能力の急速な進歩により、A … 続きを読む
カテゴリー: cs.CL
Explain with Visual Keypoints Like a Real Mentor! A Benchmark for Multimodal Solution Explanation はコメントを受け付けていません
MME-Unify: A Comprehensive Benchmark for Unified Multimodal Understanding and Generation Models
要約 既存のMLLMベンチマークは、次のために統一されたMLLM(U-MLLM) … 続きを読む
カテゴリー: cs.CV
MME-Unify: A Comprehensive Benchmark for Unified Multimodal Understanding and Generation Models はコメントを受け付けていません
PaperBench: Evaluating AI’s Ability to Replicate AI Research
要約 AIエージェントが最先端のAI研究を再現する能力を評価するベンチマークであ … 続きを読む
ZFusion: An Effective Fuser of Camera and 4D Radar for 3D Object Perception in Autonomous Driving
要約 信頼できる3Dオブジェクトの知覚は、自律運転に不可欠です。 すべての気象条 … 続きを読む
カテゴリー: cs.CV
ZFusion: An Effective Fuser of Camera and 4D Radar for 3D Object Perception in Autonomous Driving はコメントを受け付けていません
Hybrid Real- and Complex-valued Neural Network Architecture
要約 \ emphing {hybrid} Real-およびcomplex-va … 続きを読む
カテゴリー: cs.LG
Hybrid Real- and Complex-valued Neural Network Architecture はコメントを受け付けていません
Optimal Embedding Guided Negative Sample Generation for Knowledge Graph Link Prediction
要約 ナレッジグラフ埋め込み(KGE)モデルは、知識グラフの構造情報を新しいリン … 続きを読む
HumanDreamer-X: Photorealistic Single-image Human Avatars Reconstruction via Gaussian Restoration
要約 シングルイメージの人間の再構築は、デジタルヒューマンモデリングアプリケーシ … 続きを読む
カテゴリー: cs.CV
HumanDreamer-X: Photorealistic Single-image Human Avatars Reconstruction via Gaussian Restoration はコメントを受け付けていません