-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Multimodal Diffusion Bridge with Attention-Based SAR Fusion for Satellite Image Cloud Removal
要約 ディープラーニングは、合成開口レーダー(SAR)画像と融合することで、光学 … 続きを読む
カテゴリー: cs.CV
Multimodal Diffusion Bridge with Attention-Based SAR Fusion for Satellite Image Cloud Removal はコメントを受け付けていません
Autonomous and Self-Adapting System for Synthetic Media Detection and Attribution
要約 ジェネレーティブAIの急速な進歩により、非常にリアルな合成画像の作成が可能 … 続きを読む
VISTA-OCR: Towards generative and interactive end to end OCR models
要約 を紹介します。(Vision and Spatially-aware Te … 続きを読む
カテゴリー: cs.CV
VISTA-OCR: Towards generative and interactive end to end OCR models はコメントを受け付けていません
Quantifying the uncertainty of model-based synthetic image quality metrics
要約 合成的に生成された画像(例えば拡散モデルによって生成された画像)の品質は、 … 続きを読む
カテゴリー: cs.CV
Quantifying the uncertainty of model-based synthetic image quality metrics はコメントを受け付けていません
An Algebraic Geometry Approach to Viewing Graph Solvability
要約 ビューインググラフの可解性という概念は、structure-from-mo … 続きを読む
AdaCM$^2$: On Understanding Extremely Long-Term Video with Adaptive Cross-Modality Memory Reduction
要約 大規模言語モデル(LLM)の進歩により、LLMを視覚モデルに組み込むことで … 続きを読む
Shape My Moves: Text-Driven Shape-Aware Synthesis of Human Motions
要約 これは、均質化された標準的な体型を学習することが容易なため、既存のテキスト … 続きを読む
カテゴリー: cs.CV
Shape My Moves: Text-Driven Shape-Aware Synthesis of Human Motions はコメントを受け付けていません
Bonsai: Interpretable Tree-Adaptive Grounded Reasoning
要約 汎用的な協調エージェントを開発するためには、(1)新しいドメインに適応でき … 続きを読む
MME-Unify: A Comprehensive Benchmark for Unified Multimodal Understanding and Generation Models
要約 既存のMLLMベンチマークは、Unified MLLM(U-MLLM)の評 … 続きを読む
カテゴリー: cs.CV
MME-Unify: A Comprehensive Benchmark for Unified Multimodal Understanding and Generation Models はコメントを受け付けていません
Overcoming Deceptiveness in Fitness Optimization with Unsupervised Quality-Diversity
要約 政策最適化は、目的関数または適合度関数に従って制御問題の最適解を求めるもの … 続きを読む