-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
VLM Can Be a Good Assistant: Enhancing Embodied Visual Tracking with Self-Improving Vision-Language Models
要約 環境視覚モデル(VLM)を使用して具体化された視覚追跡(EVT)を強化する … 続きを読む
Structurally Different Neural Network Blocks for the Segmentation of Atrial and Aortic Perivascular Adipose Tissue in Multi-centre CT Angiography Scans
要約 畳み込みニューラルネットワーク(CNNS)の出現以来、視覚変圧器(VITS … 続きを読む
Surf2CT: Cascaded 3D Flow Matching Models for Torso 3D CT Synthesis from Skin Surface
要約 外部表面スキャンと単純な人口統計データ(年齢、性別、身長、体重)からのヒト … 続きを読む
PathFL: Multi-Alignment Federated Learning for Pathology Image Segmentation
要約 複数のセンター全体での病理学の画像セグメンテーションは、イメージングモダリ … 続きを読む
カテゴリー: cs.CV
PathFL: Multi-Alignment Federated Learning for Pathology Image Segmentation はコメントを受け付けていません
PrismLayers: Open Data for High-Quality Multi-Layer Transparent Image Generative Models
要約 テキストプロンプトから高品質の多層透明な画像を生成すると、新しいレベルのク … 続きを読む
カテゴリー: cs.CV
PrismLayers: Open Data for High-Quality Multi-Layer Transparent Image Generative Models はコメントを受け付けていません
Thinking with Generated Images
要約 生成された画像で思考を提示します。これは、中間視覚的思考ステップの自発的な … 続きを読む
RiverMamba: A State Space Model for Global River Discharge and Flood Forecasting
要約 河川排出予測の最近の深い学習アプローチにより、洪水予測の精度と効率が向上し … 続きを読む
Scaling-up Perceptual Video Quality Assessment
要約 データスケーリング法は、さまざまな下流タスクにわたる大規模なマルチモーダル … 続きを読む
Deep Learning-Based BMD Estimation from Radiographs with Conformal Uncertainty Quantification
要約 限られたDXAアクセスは、骨粗鬆症のスクリーニングを妨げます。 この概念実 … 続きを読む