-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Why context matters in VQA and Reasoning: Semantic interventions for VLM input modalities
要約 幻覚やモデルの失敗など、生成 AI にはさまざまな制限があるため、視覚言語 … 続きを読む
カテゴリー: cs.AI
Why context matters in VQA and Reasoning: Semantic interventions for VLM input modalities はコメントを受け付けていません
FactAlign: Long-form Factuality Alignment of Large Language Models
要約 大規模な言語モデルは、次世代の情報アクセス エンジンとして大きな可能性を示 … 続きを読む
U-shaped and Inverted-U Scaling behind Emergent Abilities of Large Language Models
要約 大規模言語モデル (LLM) は、一部の下流タスクで新たな能力を発揮するこ … 続きを読む
From Prohibition to Adoption: How Hong Kong Universities Are Navigating ChatGPT in Academic Workflows
要約 この論文は、香港の大学が ChatGPT を禁止していた時代と、ChatG … 続きを読む
CreDes: Causal Reasoning Enhancement and Dual-End Searching for Solving Long-Range Reasoning Problems using LLMs
要約 大規模言語モデル (LLM) では、因果的幻覚と巨大な検索空間が部分的に原 … 続きを読む
Performant, Memory Efficient and Scalable Multi-Agent Reinforcement Learning
要約 マルチエージェント強化学習 (MARL) の分野がより大規模で複雑な環境に … 続きを読む
LogicAsker: Evaluating and Improving the Logical Reasoning Ability of Large Language Models
要約 ChatGPT や GPT-4 などの大規模言語モデル (LLM) の論理 … 続きを読む
Towards a Theoretical Understanding of Synthetic Data in LLM Post-Training: A Reverse-Bottleneck Perspective
要約 高品質で特定のデータが不足しているため、合成データは大規模言語モデル (L … 続きを読む
Auto-Demo Prompting: Leveraging Generated Outputs as Demonstrations for Enhanced Batch Prompting
要約 バッチ プロンプトは、計算効率の向上を目的として、複数の入力を同時に処理す … 続きを読む
Evaluating Robustness of Reward Models for Mathematical Reasoning
要約 報酬モデルは、ヒューマン フィードバック (RLHF) システムからの強化 … 続きを読む