-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
LoRID: Low-Rank Iterative Diffusion for Adversarial Purification
要約 この研究は、拡散ベースの浄化方法、つまり拡散モデルを利用して敵対的な例にお … 続きを読む
Derivative-Free Guidance in Continuous and Discrete Diffusion Models with Soft Value-Based Decoding
要約 拡散モデルは、画像、分子、DNA、RNA、タンパク質配列の自然な設計空間を … 続きを読む
Windows Agent Arena: Evaluating Multi-Modal OS Agents at Scale
要約 大規模言語モデル (LLM) は、計画と推論を必要とするマルチモーダルなタ … 続きを読む
カテゴリー: cs.AI
Windows Agent Arena: Evaluating Multi-Modal OS Agents at Scale はコメントを受け付けていません
AnySkin: Plug-and-play Skin Sensing for Robotic Touch
要約 触覚センシングは重要かつ有用なセンシングモダリティとして広く受け入れられて … 続きを読む
NITRO-D: Native Integer-only Training of Deep Convolutional Neural Networks
要約 量子化は、ディープ ニューラル ネットワーク (DNN) の着実に増加する … 続きを読む
Unified Domain Adaptive Semantic Segmentation
要約 監視なしドメイン適応型セマンティック セグメンテーション (UDA-SS) … 続きを読む
Zero-Shot Whole Slide Image Retrieval in Histopathology Using Embeddings of Foundation Models
要約 私たちは、画像検索のために、最近公開された病理組織学用の基礎モデルをテスト … 続きを読む
What Makes a Maze Look Like a Maze?
要約 人間の視覚的理解のユニークな側面は、抽象的な概念を柔軟に解釈する能力です。 … 続きを読む
LT3SD: Latent Trees for 3D Scene Diffusion
要約 我々は、大規模な 3D シーン生成のための新しい潜在拡散モデル LT3SD … 続きを読む
IFAdapter: Instance Feature Control for Grounded Text-to-Image Generation
要約 Text-to-Image (T2I) 拡散モデルは、個々のインスタンスの … 続きを読む