-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Can Test-Time Scaling Improve World Foundation Model?
要約 現在の観測と入力から将来の状態を予測することにより物理的世界をシミュレート … 続きを読む
カテゴリー: cs.CV
Can Test-Time Scaling Improve World Foundation Model? はコメントを受け付けていません
Self-Supervised Pretraining for Aerial Road Extraction
要約 航空画像セグメンテーションのための深いニューラルネットワークには、大量のラ … 続きを読む
PathOrchestra: A Comprehensive Foundation Model for Computational Pathology with Over 100 Diverse Clinical-Grade Tasks
要約 高解像度の病理学的画像に固有の複雑さと変動性は、計算病理学に重要な課題をも … 続きを読む
カテゴリー: cs.CV
PathOrchestra: A Comprehensive Foundation Model for Computational Pathology with Over 100 Diverse Clinical-Grade Tasks はコメントを受け付けていません
ORAL: Prompting Your Large-Scale LoRAs via Conditional Recurrent Diffusion
要約 パラメーター生成は、ニューラルネットワーク開発の新しいパラダイムとして浮上 … 続きを読む
InstructRestore: Region-Customized Image Restoration with Human Instructions
要約 拡散前ベースの画像修復の大幅な進歩にもかかわらず、ほとんどの既存の方法は画 … 続きを読む
カテゴリー: cs.CV
InstructRestore: Region-Customized Image Restoration with Human Instructions はコメントを受け付けていません
StochasticSplats: Stochastic Rasterization for Sorting-Free 3D Gaussian Splatting
要約 3D Gaussian Splatting(3DGS)は、多くのアプリケー … 続きを読む
Adapting Vision Foundation Models for Real-time Ultrasound Image Segmentation
要約 リアルタイムの超音波画像セグメンテーションのために階層ビジョンファンデーシ … 続きを読む
カテゴリー: cs.CV
Adapting Vision Foundation Models for Real-time Ultrasound Image Segmentation はコメントを受け付けていません
ERUPT: Efficient Rendering with Unposed Patch Transformer
要約 この作品は、RGB画像の小さなコレクションからの多様なシーンでの新しいビュ … 続きを読む
カテゴリー: cs.CV
ERUPT: Efficient Rendering with Unposed Patch Transformer はコメントを受け付けていません
Exploring the Effect of Reinforcement Learning on Video Understanding: Insights from SEED-Bench-R1
要約 Chain of Thound(COT)の最近の進歩により、大規模な言語モ … 続きを読む
Any2Caption:Interpreting Any Condition to Caption for Controllable Video Generation
要約 現在のビデオ生成コミュニティ内の正確なユーザー意図解釈のボトルネックに対処 … 続きを読む