-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
VGR: Visual Grounded Reasoning
要約 マルチモーダルの考え方(COT)の推論の分野では、既存のアプローチは主に言 … 続きを読む
Improving Surgical Risk Prediction Through Integrating Automated Body Composition Analysis: a Retrospective Trial on Colectomy Surgery
要約 目的:CTスキャンから術前の体組成メトリックが自動的に抽出されたかどうかを … 続きを読む
カテゴリー: cs.CV
Improving Surgical Risk Prediction Through Integrating Automated Body Composition Analysis: a Retrospective Trial on Colectomy Surgery はコメントを受け付けていません
crossMoDA Challenge: Evolution of Cross-Modality Domain Adaptation Techniques for Vestibular Schwannoma and Cochlea Segmentation from 2021 to 2023
要約 医療画像コンピューティングとコンピューター支援介入(MICCAI)に関する … 続きを読む
SIMSHIFT: A Benchmark for Adapting Neural Surrogates to Distribution Shifts
要約 部分的な微分方程式(PDE)の神経代理人は、新しい材料の種類や構造的次元な … 続きを読む
カテゴリー: cs.CV, cs.LG, physics.comp-ph
SIMSHIFT: A Benchmark for Adapting Neural Surrogates to Distribution Shifts はコメントを受け付けていません
Affogato: Learning Open-Vocabulary Affordance Grounding with Automated Data Generation at Scale
要約 相互作用の自然言語の説明に基づいたアフォーダンス接地局在オブジェクト領域 … 続きを読む
カテゴリー: cs.CV
Affogato: Learning Open-Vocabulary Affordance Grounding with Automated Data Generation at Scale はコメントを受け付けていません
EMLoC: Emulator-based Memory-efficient Fine-tuning with LoRA Correction
要約 オープンソースの基礎モデルでは、迅速な採用と開発が見られ、多様なドメイン全 … 続きを読む
PiPViT: Patch-based Visual Interpretable Prototypes for Retinal Image Analysis
要約 背景と目的:プロトタイプベースの方法は、細粒のパートプロトタイプを学習する … 続きを読む
PhysNav-DG: A Novel Adaptive Framework for Robust VLM-Sensor Fusion in Navigation Applications
要約 多様な環境とドメインでの堅牢なナビゲーションには、正確な状態推定と透明な意 … 続きを読む
IQE-CLIP: Instance-aware Query Embedding for Zero-/Few-shot Anomaly Detection in Medical Domain
要約 最近、クリップなどのビジョン言語モデルの急速な進歩は、ゼロ/少ないショット … 続きを読む
カテゴリー: cs.CV
IQE-CLIP: Instance-aware Query Embedding for Zero-/Few-shot Anomaly Detection in Medical Domain はコメントを受け付けていません
MMMG: A Massive, Multidisciplinary, Multi-Tier Generation Benchmark for Text-to-Image Reasoning
要約 このホワイトペーパーでは、画像生成モデルの推論能力を調査するために、大規模 … 続きを読む