-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
ACECODER: Acing Coder RL via Automated Test-Case Synthesis
要約 最近のコーダーモデルのほとんどの進歩は、監視された微調整(SFT)によって … 続きを読む
Great Models Think Alike and this Undermines AI Oversight
要約 言語モデル(LM)機能が進歩するにつれて、それらを大規模に評価および監督す … 続きを読む
ChamaleonLLM: Batch-Aware Dynamic Low-Rank Adaptation via Inference-Time Clusters
要約 大規模な言語モデル(LLMS)の最近の進歩により、多様なタスク全体で顕著な … 続きを読む
Speak Easy: Eliciting Harmful Jailbreaks from LLMs with Simple Interactions
要約 広範な安全整合の取り組みにもかかわらず、大規模な言語モデル(LLM)は、有 … 続きを読む
MuJo: Multimodal Joint Feature Space Learning for Human Activity Recognition
要約 人間の活動認識(HAR)は、ヘルスケア、スポーツ、フィットネス、セキュリテ … 続きを読む
DEFAME: Dynamic Evidence-based FAct-checking with Multimodal Experts
要約 偽情報の拡散は、信頼性が高くスケーラブルな事実確認ソリューションを必要とし … 続きを読む
Evaluating Numerical Reasoning in Text-to-Image Models
要約 テキストから画像への生成モデルは、自然言語を使用して記述されている概念を忠 … 続きを読む
Ola: Pushing the Frontiers of Omni-Modal Language Model with Progressive Modality Alignment
要約 特にGPT-4Oに続く大規模な言語モデルの最近の進歩により、より多くのモダ … 続きを読む
UGPhysics: A Comprehensive Benchmark for Undergraduate Physics Reasoning with Large Language Models
要約 大規模な言語モデル(LLM)は、特に数学で複雑な推論タスクを解決する際に顕 … 続きを読む
Critique Fine-Tuning: Learning to Critique is More Effective than Learning to Imitate
要約 監視された微調整(SFT)は、一般的に言語モデルをトレーニングして、指定さ … 続きを読む
カテゴリー: cs.CL
Critique Fine-Tuning: Learning to Critique is More Effective than Learning to Imitate はコメントを受け付けていません