-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Automatic Data Curation for Self-Supervised Learning: A Clustering-Based Approach
要約 自己教師あり機能は、最新の機械学習システムの基礎です。 通常、データ収集に … 続きを読む
Less is more: Summarizing Patch Tokens for efficient Multi-Label Class-Incremental Learning
要約 プロンプト チューニングは、タスク固有のパラメータ (またはプロンプト) … 続きを読む
HDC: Hierarchical Semantic Decoding with Counting Assistance for Generalized Referring Expression Segmentation
要約 新しく提案された Generalized Referring Expres … 続きを読む
Exposing Image Classifier Shortcuts with Counterfactual Frequency (CoF) Tables
要約 画像分類におけるディープラーニングの台頭により、前例のない精度がもたらされ … 続きを読む
VDGD: Mitigating LVLM Hallucinations in Cognitive Prompts by Bridging the Visual Perception Gap
要約 実用的なアプリケーションとしての大規模視覚言語モデル (LVLM) への最 … 続きを読む
Fast Sampling Through The Reuse Of Attention Maps In Diffusion Models
要約 テキストから画像への拡散モデルは、柔軟でリアルな画像合成のための前例のない … 続きを読む
Prompt-Aware Adapter: Towards Learning Adaptive Visual Tokens for Multimodal Large Language Models
要約 視覚と言語モダリティの間のギャップを埋めるために、マルチモーダル大規模言語 … 続きを読む
Ctrl-Adapter: An Efficient and Versatile Framework for Adapting Diverse Controls to Any Diffusion Model
要約 ControlNet は、深度マップ、落書き/スケッチ、人間のポーズなど、 … 続きを読む
WorDepth: Variational Language Prior for Monocular Depth Estimation
要約 単一の画像からの 3 次元 (3D) 再構成は、スケールなどの固有の曖昧さ … 続きを読む
Score identity Distillation: Exponentially Fast Distillation of Pretrained Diffusion Models for One-Step Generation
要約 スコア同一性蒸留 (SiD) を導入します。これは、事前トレーニングされた … 続きを読む