-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Improving Surgical Risk Prediction Through Integrating Automated Body Composition Analysis: a Retrospective Trial on Colectomy Surgery
要約 目的:CTスキャンから術前の体組成メトリックが自動的に抽出されたかどうかを … 続きを読む
カテゴリー: cs.CV
Improving Surgical Risk Prediction Through Integrating Automated Body Composition Analysis: a Retrospective Trial on Colectomy Surgery はコメントを受け付けていません
crossMoDA Challenge: Evolution of Cross-Modality Domain Adaptation Techniques for Vestibular Schwannoma and Cochlea Segmentation from 2021 to 2023
要約 医療画像コンピューティングとコンピューター支援介入(MICCAI)に関する … 続きを読む
SIMSHIFT: A Benchmark for Adapting Neural Surrogates to Distribution Shifts
要約 部分的な微分方程式(PDE)の神経代理人は、新しい材料の種類や構造的次元な … 続きを読む
カテゴリー: cs.CV, cs.LG, physics.comp-ph
SIMSHIFT: A Benchmark for Adapting Neural Surrogates to Distribution Shifts はコメントを受け付けていません
Affogato: Learning Open-Vocabulary Affordance Grounding with Automated Data Generation at Scale
要約 相互作用の自然言語の説明に基づいたアフォーダンス接地局在オブジェクト領域 … 続きを読む
カテゴリー: cs.CV
Affogato: Learning Open-Vocabulary Affordance Grounding with Automated Data Generation at Scale はコメントを受け付けていません
EMLoC: Emulator-based Memory-efficient Fine-tuning with LoRA Correction
要約 オープンソースの基礎モデルでは、迅速な採用と開発が見られ、多様なドメイン全 … 続きを読む
RationalVLA: A Rational Vision-Language-Action Model with Dual System
要約 現実世界のロボット展開の基本的な要件は、自然言語の指示を理解し、対応する能 … 続きを読む
カテゴリー: cs.RO
RationalVLA: A Rational Vision-Language-Action Model with Dual System はコメントを受け付けていません
Persistent Topological Features in Large Language Models
要約 大規模な言語モデルの意思決定プロセスを理解することは、広範なアプリケーショ … 続きを読む
PiPViT: Patch-based Visual Interpretable Prototypes for Retinal Image Analysis
要約 背景と目的:プロトタイプベースの方法は、細粒のパートプロトタイプを学習する … 続きを読む
PhysNav-DG: A Novel Adaptive Framework for Robust VLM-Sensor Fusion in Navigation Applications
要約 多様な環境とドメインでの堅牢なナビゲーションには、正確な状態推定と透明な意 … 続きを読む
Accelerating Diffusion Large Language Models with SlowFast Sampling: The Three Golden Principles
要約 拡散ベースの言語モデル(DLLM)は、並列トークンの生成を有効にし、推論潜 … 続きを読む