-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
LLaDA-V: Large Language Diffusion Models with Visual Instruction Tuning
要約 この作業では、現在のマルチモーダルアプローチで支配的な自己網性パラダイムか … 続きを読む
NovelSeek: When Agent Becomes the Scientist — Building Closed-Loop System from Hypothesis to Verification
要約 人工知能(AI)は、科学研究のパラダイムの変換を加速し、研究効率を高めるだ … 続きを読む
Efficient Correlation Volume Sampling for Ultra-High-Resolution Optical Flow Estimation
要約 最近の光フロー推定方法は、しばしば密な全ペア相関ボリュームからのローカルコ … 続きを読む
Motion by Queries: Identity-Motion Trade-offs in Text-to-Video Generation
要約 テキスト間拡散モデルは、テキストの説明からコヒーレントなビデオクリップを生 … 続きを読む
カテゴリー: cs.CV
Motion by Queries: Identity-Motion Trade-offs in Text-to-Video Generation はコメントを受け付けていません
MedFrameQA: A Multi-Image Medical VQA Benchmark for Clinical Reasoning
要約 既存の医療用VQAベンチマークは、主に単一イメージ分析に焦点を当てています … 続きを読む
Harnessing the Computation Redundancy in ViTs to Boost Adversarial Transferability
要約 Vision Transformers(VITS)は、多くの安全性クリティ … 続きを読む
カテゴリー: cs.CV
Harnessing the Computation Redundancy in ViTs to Boost Adversarial Transferability はコメントを受け付けていません
UniPhy: Learning a Unified Constitutive Model for Inverse Physics Simulation
要約 私たちは、多様な材料の物理的特性をコードすることができる一般的な潜在的な神 … 続きを読む
カテゴリー: cs.CV
UniPhy: Learning a Unified Constitutive Model for Inverse Physics Simulation はコメントを受け付けていません
OpenSeg-R: Improving Open-Vocabulary Segmentation via Step-by-Step Visual Reasoning
要約 オープンボキャブラリーセグメンテーション(OVS)は、事前定義されたカテゴ … 続きを読む
カテゴリー: cs.CV
OpenSeg-R: Improving Open-Vocabulary Segmentation via Step-by-Step Visual Reasoning はコメントを受け付けていません
Creatively Upscaling Images with Global-Regional Priors
要約 現代の拡散モデルは、テキストからイメージの生成において顕著な能力を示してい … 続きを読む
Incorporating Visual Correspondence into Diffusion Model for Virtual Try-On
要約 拡散モデルは、Virtual Try-On(VTON)タスクで予備的な成功 … 続きを読む