-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Multi-Domain Explainability of Preferences
要約 人間の好み、LLM-as-a-a-judge(laaj)、報酬モデルなどの … 続きを読む
カテゴリー: cs.CL
Multi-Domain Explainability of Preferences はコメントを受け付けていません
On-Policy RL with Optimal Reward Baseline
要約 強化学習アルゴリズムは、大規模な言語モデルを人間の好みに合わせて、推論能力 … 続きを読む
Jigsaw-R1: A Study of Rule-based Visual Reinforcement Learning with Jigsaw Puzzles
要約 ルールベースの強化学習(RL)をマルチモーダル大手言語モデル(MLLMS) … 続きを読む
X-TURING: Towards an Enhanced and Efficient Turing Test for Long-Term Dialogue Agents
要約 チューリングテストでは、AISが自然言語の会話で人間のような行動を示すかど … 続きを読む
STeCa: Step-level Trajectory Calibration for LLM Agent Learning
要約 大規模な言語モデル(LLM)ベースのエージェントは、環境と動的に対話するこ … 続きを読む
Satori-SWE: Evolutionary Test-Time Scaling for Sample-Efficient Software Engineering
要約 言語モデル(LMS)は、標準化されたコーディングベンチマークでうまく機能し … 続きを読む
EXIT: Context-Aware Extractive Compression for Enhancing Retrieval-Augmented Generation
要約 Exitを導入します。Exitは、質問回答(QA)で検索された生成(RAG … 続きを読む
Table-R1: Inference-Time Scaling for Table Reasoning
要約 この作業では、テーブル推論タスクの推論時間スケーリングを調査する最初の研究 … 続きを読む
カテゴリー: cs.CL
Table-R1: Inference-Time Scaling for Table Reasoning はコメントを受け付けていません
Characterizing the Expressivity of Transformer Language Models
要約 トランスベースの言語モデル(LMS)は、広範な経験的成功を達成していますが … 続きを読む
カテゴリー: cs.CL
Characterizing the Expressivity of Transformer Language Models はコメントを受け付けていません
RULEBREAKERS: Challenging LLMs at the Crossroads between Formal Logic and Human-like Reasoning
要約 正式なロジックにより、コンピューターは象徴的な形式で文を表すことにより、コ … 続きを読む
カテゴリー: cs.CL
RULEBREAKERS: Challenging LLMs at the Crossroads between Formal Logic and Human-like Reasoning はコメントを受け付けていません