-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
DeduCE: Deductive Consistency as a Framework to Evaluate LLM Reasoning
要約 Olympiadレベルの推論の問題での大きなパフォーマンスにもかかわらず、 … 続きを読む
Self-Steering Language Models
要約 テスト時間の推論により、言語モデルは複雑なタスクに取り組むことができますが … 続きを読む
KG-LLM-Bench: A Scalable Benchmark for Evaluating LLM Reasoning on Textualized Knowledge Graphs
要約 知識グラフは、最新の事実の知識を大規模な言語モデル(LLM)に注入するため … 続きを読む
Sculpting Subspaces: Constrained Full Fine-Tuning in LLMs for Continual Learning
要約 大規模な言語モデル(LLMS)での継続的な学習は、壊滅的な忘却を受けやすく … 続きを読む
Dolphin: Moving Towards Closed-loop Auto-research through Thinking, Practice, and Feedback
要約 科学研究のパラダイムは、人工知能(AI)の発達により、深い変換を受けていま … 続きを読む
A Unified Agentic Framework for Evaluating Conditional Image Generation
要約 条件付き画像生成は、コンテンツをパーソナライズする能力について大きな注目を … 続きを読む
Unsolvable Problem Detection: Robust Understanding Evaluation for Large Multimodal Models
要約 このペーパーでは、大規模なマルチモーダルモデル(LMMS)の堅牢な理解能力 … 続きを読む
Automated Generation of Challenging Multiple-Choice Questions for Vision Language Model Evaluation
要約 ビジョン言語モデル(VLMS)の迅速な発展には、厳密で信頼できる評価が必要 … 続きを読む
Kaleidoscope: In-language Exams for Massively Multilingual Vision Evaluation
要約 ビジョン言語モデル(VLMS)の評価は、主に英語のベンチマークに依存してお … 続きを読む
SkillWeaver: Web Agents can Self-Improve by Discovering and Honing Skills
要約 複雑な環境で生き残り、繁栄するために、人間は環境探査、経験の階層的な抽象化 … 続きを読む