-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Sharpness-Aware Minimization with Z-Score Gradient Filtering for Neural Networks
要約 Sharpness-Aware Minimization(SAM)は、パラ … 続きを読む
Question-Answering Dense Video Events
要約 このペーパーでは、密集したビデオイベントに関する質問を提示します。これは、 … 続きを読む
Efficient Flow Matching using Latent Variables
要約 フローマッチングモデルは、確率的生成モデルの間で画像生成タスクに大きな可能 … 続きを読む
‘I Can See Forever!’: Evaluating Real-time VideoLLMs for Assisting Individuals with Visual Impairments
要約 視覚障害のある人口、特に重度の視覚障害者は現在大きく、日々の活動は彼らにと … 続きを読む
Defining and Quantifying Creative Behavior in Popular Image Generators
要約 生成AIモデルの創造性は、決定的な答えなしに、過去数年間で科学的議論の対象 … 続きを読む
DFVO: Learning Darkness-free Visible and Infrared Image Disentanglement and Fusion All at Once
要約 可視および赤外線融合は、画像融合の分野で最も重要なタスクの1つであり、高レ … 続きを読む
EchoInk-R1: Exploring Audio-Visual Reasoning in Multimodal LLMs via Reinforcement Learning
要約 マルチモーダル大手言語モデル(MLLM)は、テキスト、ビジョン、オーディオ … 続きを読む
Absolute Zero: Reinforced Self-play Reasoning with Zero Data
要約 検証可能な報酬(RLVR)による強化学習は、結果ベースの報酬から直接学習す … 続きを読む
Capability-Driven Skill Generation with LLMs: A RAG-Based Approach for Reusing Existing Libraries and Interfaces
要約 最新の自動化システムは、1つのソリューションとしての機能とスキルをアプロー … 続きを読む
The Unreasonable Effectiveness of Discrete-Time Gaussian Process Mixtures for Robot Policy Learning
要約 ロボット操作における柔軟なポリシー表現と模倣学習のための新しいアプローチで … 続きを読む