-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
EMC$^2$: Efficient MCMC Negative Sampling for Contrastive Learning with Global Convergence
要約 対比学習における主な課題は、データのより適切なエンコードを学習するために、 … 続きを読む
E3: Ensemble of Expert Embedders for Adapting Synthetic Image Detectors to New Generators Using Limited Data
要約 生成 AI が急速に進歩するにつれて、新しい合成画像ジェネレーターが急速な … 続きを読む
Private Attribute Inference from Images with Vision-Language Models
要約 大規模言語モデル (LLM) が日常業務やデジタル インタラクションの至る … 続きを読む
LoopAnimate: Loopable Salient Object Animation
要約 拡散モデルに基づくビデオ生成の研究は急速に進んでいます。 ただし、オブジェ … 続きを読む
SplaTAM: Splat, Track & Map 3D Gaussians for Dense RGB-D SLAM
要約 高密度同時ローカライゼーションおよびマッピング (SLAM) は、ロボット … 続きを読む
Mixed Prototype Consistency Learning for Semi-supervised Medical Image Segmentation
要約 最近、半教師あり医療画像セグメンテーションにおいてプロトタイプ学習が登場し … 続きを読む
LaDiC: Are Diffusion Models Really Inferior to Autoregressive Counterparts for Image-to-Text Generation?
要約 拡散モデルは、テキストから画像への生成において顕著な機能を発揮しました。 … 続きを読む
Hunting imaging biomarkers in pulmonary fibrosis: Benchmarks of the AIIB23 challenge
要約 気道関連の定量的画像バイオマーカーは、肺疾患の検査、診断、予後にとって重要 … 続きを読む
COMBO: Compositional World Models for Embodied Multi-Agent Cooperation
要約 この論文では、部分的な自己中心的な世界観しか与えられない場合、分散型エージ … 続きを読む
GROUNDHOG: Grounding Large Language Models to Holistic Segmentation
要約 ほとんどのマルチモーダル大規模言語モデル (MLLM) は、因果関係のある … 続きを読む