-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Latent Diffusion Planning for Imitation Learning
要約 模倣学習における最近の進捗状況は、複雑な視覚運動タスク、マルチモーダル分布 … 続きを読む
SSLR: A Semi-Supervised Learning Method for Isolated Sign Language Recognition
要約 手話は、難聴を無効にする人々の主要なコミュニケーション言語です。 手話認識 … 続きを読む
Representation Learning via Non-Contrastive Mutual Information
要約 ラベル付けデータは多くの場合、非常に時間がかかり、高価であるため、ほとんど … 続きを読む
Fast Adversarial Training with Weak-to-Strong Spatial-Temporal Consistency in the Frequency Domain on Videos
要約 敵対的な訓練(AT)は、MIN-MAX最適化アプローチを介して敵対的な堅牢 … 続きを読む
CF-CAM: Cluster Filter Class Activation Mapping for Reliable Gradient-Based Interpretability
要約 深い学習が進行し続けるにつれて、ニューラルネットワークの意思決定の透明性は … 続きを読む
PMG: Progressive Motion Generation via Sparse Anchor Postures Curriculum Learning
要約 コンピューターアニメーション、ゲームデザイン、および人間コンピューターの相 … 続きを読む
Detecting and Understanding Hateful Contents in Memes Through Captioning and Visual Question-Answering
要約 ミームはユーモアや文化的な解説に広く使用されていますが、憎悪なコンテンツを … 続きを読む
V$^2$R-Bench: Holistically Evaluating LVLM Robustness to Fundamental Visual Variations
要約 大規模なビジョン言語モデル(LVLMS)は、さまざまなビジョン言語タスクに … 続きを読む
Noise-Tolerant Coreset-Based Class Incremental Continual Learning
要約 コンピュータービジョンの多くのアプリケーションでは、展開後に新しいデータ分 … 続きを読む
Towards Explainable AI: Multi-Modal Transformer for Video-based Image Description Generation
要約 ビデオアクションの理解と分析は、特にインテリジェント監視や自律システムなど … 続きを読む