-
最近の投稿
- Learning to Recover: Dynamic Reward Shaping with Wheel-Leg Coordination for Fallen Robots
- An Integrated Visual Servoing Framework for Precise Robotic Pruning Operations in Modern Commercial Orchard
- Adaptive Locomotion on Mud through Proprioceptive Sensing of Substrate Properties
- TD-TOG Dataset: Benchmarking Zero-Shot and One-Shot Task-Oriented Grasping for Object Generalization
- Hierarchical Intention-Aware Expressive Motion Generation for Humanoid Robots
-
最近のコメント
表示できるコメントはありません。 cs.AI (39326) cs.CL (29768) cs.CV (44705) cs.HC (2997) cs.LG (44251) cs.RO (23494) cs.SY (3583) eess.IV (5135) eess.SY (3575) stat.ML (5752)
「cs.CL」カテゴリーアーカイブ
Does Thinking More always Help? Understanding Test-Time Scaling in Reasoning Models
要約 推論モデルのテスト時間スケーリングの最近の傾向(例:Openai O1、D … 続きを読む
Efficient Knowledge Editing via Minimal Precomputation
要約 Memitのような知識編集方法は、単一の文を使用して事実とその結果を更新す … 続きを読む
Seeing What Tastes Good: Revisiting Multimodal Distributional Semantics in the Billion Parameter Era
要約 人間の学習と概念表現は、最先端の基礎モデルとは対照的に、感覚運動体験に基づ … 続きを読む
Mitigating Hallucinations in Large Vision-Language Models via Entity-Centric Multimodal Preference Optimization
要約 大規模な視覚言語モデル(LVLMS)は、複数のタスクにわたって印象的な機能 … 続きを読む
Multimodal Tabular Reasoning with Privileged Structured Information
要約 表形式の推論には、表形式データに対するマルチステップ情報抽出と論理的推論が … 続きを読む
MMR-V: What’s Left Unsaid? A Benchmark for Multimodal Deep Reasoning in Videos
要約 ビデオのシーケンシャル構造は、マルチフレームの証拠を見つけてマルチモーダル … 続きを読む
A Survey on (M)LLM-Based GUI Agents
要約 グラフィカルユーザーインターフェイス(GUI)エージェントは、ルールベース … 続きを読む
Advancing Multimodal Reasoning: From Optimized Cold Start to Staged Reinforcement Learning
要約 複雑なテキストタスクにおけるDeepSeek-R1の顕著な推論能力に触発さ … 続きを読む
Critique-GRPO: Advancing LLM Reasoning with Natural Language and Numerical Feedback
要約 スカラー報酬のような数値フィードバックを用いた強化学習(RL)の最近の進歩 … 続きを読む