-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年3月
DSO: Aligning 3D Generators with Simulation Feedback for Physical Soundness
要約 ほとんどの3Dオブジェクトジェネレーターは、美的品質に焦点を当てており、ア … 続きを読む
Q-Insight: Understanding Image Quality via Visual Reinforcement Learning
要約 画像品質評価(IQA)は、画像の知覚的な視覚品質に焦点を当て、画像の再構築 … 続きを読む
カテゴリー: cs.CV
Q-Insight: Understanding Image Quality via Visual Reinforcement Learning はコメントを受け付けていません
Outlier dimensions favor frequent tokens in language models
要約 最後の層の外れ値の寸法、つまり、大部分の入力に対して極端な活性化を示す寸法 … 続きを読む
OmniVox: Zero-Shot Emotion Recognition with Omni-LLMs
要約 特に音声を含むマルチモーダル認知状態タスクでは、OMNI-LLMS(入力と … 続きを読む
カテゴリー: cs.CL
OmniVox: Zero-Shot Emotion Recognition with Omni-LLMs はコメントを受け付けていません
LOCATEdit: Graph Laplacian Optimized Cross Attention for Localized Text-Guided Image Editing
要約 テキスト誘導画像編集は、一般的な構造と背景の忠実度を維持しながら、自然言語 … 続きを読む
LaMOuR: Leveraging Language Models for Out-of-Distribution Recovery in Reinforcement Learning
要約 Deep Renection Learning(DRL)は、ロボット制御に … 続きを読む
AcL: Action Learner for Fault-Tolerant Quadruped Locomotion Control
要約 四葉型ロボットは多目的な移動スキルを学ぶことができますが、1つ以上のジョイ … 続きを読む
Generalizable Prompt Learning of CLIP: A Brief Overview
要約 クリップなどの既存のビジョン言語モデル(VLM)は、さまざまな下流タスクに … 続きを読む
Unified Multimodal Discrete Diffusion
要約 複数のモダリティにわたって理解して生成できるマルチモーダル生成モデルは、左 … 続きを読む
A Study of Perceived Safety for Soft Robotics in Caregiving Tasks
要約 このプロジェクトでは、皮膚に力をかける必要があるため、身体的接触が避けられ … 続きを読む