-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
HELMET: How to Evaluate Long-Context Language Models Effectively and Thoroughly
要約 ロングコンテクスト言語モデル(LCLM)を評価するためのベンチマークは数多 … 続きを読む
Lookback Lens: Detecting and Mitigating Contextual Hallucinations in Large Language Models Using Only Attention Maps
要約 ある文章を要約したり、質問に答えたりするよう求められると、大規模言語モデル … 続きを読む
Selective Attention Improves Transformer
要約 注意のコンテキストにある不要な要素は、パフォーマンスを低下させる。我々は、 … 続きを読む
LLMs Know More Than They Show: On the Intrinsic Representation of LLM Hallucinations
要約 大規模言語モデル(LLM)は、事実誤認、偏り、推論の失敗など、「幻覚」と総 … 続きを読む
Domain-Specific Retrieval-Augmented Generation Using Vector Stores, Knowledge Graphs, and Tensor Factorization
要約 大規模言語モデル(LLM)は、大規模なコーパスで事前に学習され、質問応答( … 続きを読む
Large Language Models as Markov Chains
要約 大規模言語モデル(LLM)は、自然言語処理タスクの広い範囲において、またそ … 続きを読む
Adaptive Inference-Time Compute: LLMs Can Predict if They Can Do Better, Even Mid-Generation
要約 推論時間計算は、大規模言語モデル(LLM)の性能を向上させるための強力なパ … 続きを読む
Unified Multi-Modal Interleaved Document Representation for Information Retrieval
要約 情報検索(IR)手法は、与えられたクエリに応答する関連文書を特定することを … 続きを読む
Justice or Prejudice? Quantifying Biases in LLM-as-a-Judge
要約 LLM-as-a-Judgeは、様々なベンチマークにおける評価手法として広 … 続きを読む
Salient Information Prompting to Steer Content in Prompt-based Abstractive Summarization
要約 大規模言語モデル(LLM)は、プロンプト技術を用いることで、領域横断的に流 … 続きを読む