-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
DilateQuant: Accurate and Efficient Diffusion Quantization via Weight Dilation
要約 拡散モデルはさまざまな画像生成タスクで優れたパフォーマンスを示していますが … 続きを読む
GeoBiked: A Dataset with Geometric Features and Automated Labeling Techniques to Enable Deep Generative Models in Engineering Design
要約 私たちは、エンジニアリング設計でディープジェネレーティブモデル (DGM) … 続きを読む
ControlCity: A Multimodal Diffusion Model Based Approach for Accurate Geospatial Data Generation and Urban Morphology Analysis
要約 ボランティア地理情報 (VGI) は、その種類が豊富で、大容量で、迅速な更 … 続きを読む
Benchmarking Domain Generalization Algorithms in Computational Pathology
要約 深層学習モデルは、計算病理学 (CPath) タスクにおいて非常に有望であ … 続きを読む
The Effect of Perceptual Metrics on Music Representation Learning for Genre Classification
要約 自然信号の主観的な品質は、客観的な知覚指標で近似できます。 人間の観察者の … 続きを読む
Ctrl-GenAug: Controllable Generative Augmentation for Medical Sequence Classification
要約 医療分野では、大規模なデータセットの利用が限られていることと、労働集約的な … 続きを読む
LingoQA: Video Question Answering for Autonomous Driving
要約 自動運転における視覚的な質問応答のための新しいデータセットおよびベンチマー … 続きを読む
Unveiling Ontological Commitment in Multi-Modal Foundation Models
要約 存在論的コミットメント、つまり使用される概念、関係、仮定は、定性的推論 ( … 続きを読む
Pre-trained Language Models Do Not Help Auto-regressive Text-to-Image Generation
要約 VQ-VAE などの画像トークナイザーの最近の進歩により、言語モデリングと … 続きを読む
Attention Prompting on Image for Large Vision-Language Models
要約 大規模言語モデル (LLM) と比較して、大規模視覚言語モデル (LVLM … 続きを読む