-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Enhancing Person-to-Person Virtual Try-On with Multi-Garment Virtual Try-Off
要約 コンピュータービジョンは、Virtual Try-On(VTON)と仮想ト … 続きを読む
Multimodal LLMs Can Reason about Aesthetics in Zero-Shot
要約 生成芸術の急速な進歩は、視覚的に心地よいイメージの作成を民主化しました。 … 続きを読む
Probing and Inducing Combinational Creativity in Vision-Language Models
要約 既存の概念を斬新なアイデアに組み合わせる能力は、人間の知性の基本的な特徴と … 続きを読む
Low-hallucination Synthetic Captions for Large-Scale Vision-Language Model Pre-training
要約 近年、ビジョン言語モデルのプリトレーニングの分野は、主に大規模な言語モデル … 続きを読む
Science-T2I: Addressing Scientific Illusions in Image Synthesis
要約 科学的知識を生成モデルに統合し、画像統合のリアリズムと一貫性を高めるための … 続きを読む
NTIRE 2025 Challenge on Short-form UGC Video Quality Assessment and Enhancement: Methods and Results
要約 このペーパーでは、短編UGCビデオ品質評価と強化に関するNTIRE 202 … 続きを読む
$\texttt{Complex-Edit}$: CoT-Like Instruction Generation for Complexity-Controllable Image Editing Benchmark
要約 さまざまな複雑さの指示にわたって命令ベースの画像編集モデルを体系的に評価す … 続きを読む
Readable Twins of Unreadable Models
要約 責任ある人工知能(AI)システムの作成は、AIの作品の現代の研究開発におけ … 続きを読む
PerceptionLM: Open-Access Data and Models for Detailed Visual Understanding
要約 ビジョン言語モデルはコンピュータービジョンの研究に不可欠ですが、多くの高性 … 続きを読む
Causality-enhanced Decision-Making for Autonomous Mobile Robots in Dynamic Environments
要約 倉庫、ショッピングセンター、病院などの共有環境でのロボットの統合の拡大は、 … 続きを読む