-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Discovering Pathology Rationale and Token Allocation for Efficient Multimodal Pathology Reasoning
要約 マルチモーダルの病理学的イメージの理解により、診断の精度を改善し、統合され … 続きを読む
HAMF: A Hybrid Attention-Mamba Framework for Joint Scene Context Understanding and Future Motion Representation Learning
要約 モーション予測は、自律的な駆動システムにおける重要な課題を表しており、周囲 … 続きを読む
Dress-1-to-3: Single Image to Simulation-Ready 3D Outfit with Diffusion Prior and Differentiable Physics
要約 大規模なモデルの最近の進歩により、画像から3Dの再構成が大幅に進歩していま … 続きを読む
カテゴリー: cs.CV
Dress-1-to-3: Single Image to Simulation-Ready 3D Outfit with Diffusion Prior and Differentiable Physics はコメントを受け付けていません
RUSplatting: Robust 3D Gaussian Splatting for Sparse-View Underwater Scene Reconstruction
要約 高忠実度の高い水中シーンを再構築することは、軽い吸収、散乱、および水生環境 … 続きを読む
カテゴリー: cs.CV
RUSplatting: Robust 3D Gaussian Splatting for Sparse-View Underwater Scene Reconstruction はコメントを受け付けていません
Exploring The Visual Feature Space for Multimodal Neural Decoding
要約 脳信号の複雑さは、マルチモーダルAIを活用して、説明可能な説明のために視覚 … 続きを読む
カテゴリー: cs.CV
Exploring The Visual Feature Space for Multimodal Neural Decoding はコメントを受け付けていません
Denoising Score Distillation: From Noisy Diffusion Pretraining to One-Step High-Quality Generation
要約 拡散モデルは、多様な自然分布全体で高解像度の現実的な画像を生成することに顕 … 続きを読む
Constructing a 3D Town from a Single Image
要約 詳細な3Dシーンを取得するには、通常、費用のかかる機器、マルチビューデータ … 続きを読む
MIRACL-VISION: A Large, multilingual, visual document retrieval benchmark
要約 ドキュメント検索は、検索および検索の高等発電(RAG)アプリケーションの重 … 続きを読む
IA-T2I: Internet-Augmented Text-to-Image Generation
要約 現在のテキストからイメージ(T2I)生成モデルは有望な結果を達成しますが、 … 続きを読む
VARD: Efficient and Dense Fine-Tuning for Diffusion Models with Value-based RL
要約 拡散モデルは、さまざまなドメインにわたって強力な生成ツールとして浮上してい … 続きを読む