-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Char-mander Use mBackdoor! A Study of Cross-lingual Backdoor Attacks in Multilingual LLMs
要約 \ textbf {c} ross-llingual \ textbf { … 続きを読む
Toward Reliable Biomedical Hypothesis Generation: Evaluating Truthfulness and Hallucination in Large Language Models
要約 大規模な言語モデル(LLM)は、バイオメディシンなどの科学分野、特に仮説生 … 続きを読む
Towards a Foundation Model for Communication Systems
要約 人工知能(AI)は、さまざまなドメインで前例のないパフォーマンスを実証して … 続きを読む
S1-Bench: A Simple Benchmark for Evaluating System 1 Thinking Capability of Large Reasoning Models
要約 S1-Benchを紹介します。S1-Benchは、審議システム2の推論では … 続きを読む
Let LLMs Break Free from Overthinking via Self-Braking Tuning
要約 Openai O1やDeepseek-R1などの大きな推論モデル(LRMS … 続きを読む
カテゴリー: cs.AI
Let LLMs Break Free from Overthinking via Self-Braking Tuning はコメントを受け付けていません
Language Models Optimized to Fool Detectors Still Have a Distinct Style (And How to Change It)
要約 マシンテキスト検出器の開発においてかなりの進歩にもかかわらず、問題は本質的 … 続きを読む
SATBench: Benchmarking LLMs’ Logical Reasoning via Automated Puzzle Generation from SAT Formulas
要約 Satbenchを紹介します。これは、ブールの満足度(SAT)の問題から派 … 続きを読む
TiEBe: Tracking Language Model Recall of Notable Worldwide Events Through Time
要約 知識の状況が進化し、大規模な言語モデル(LLM)がますます広くなるにつれて … 続きを読む
TinyV: Reducing False Negatives in Verification Improves RL for LLM Reasoning
要約 Rehnection Learning(RL)は、報酬信号でポリシーを最適 … 続きを読む
Debating for Better Reasoning: An Unsupervised Multimodal Approach
要約 大規模な言語モデル(LLM)が多様なドメインとモダリティにわたって専門知識 … 続きを読む