投稿者「jarxiv」のアーカイブ

NoveltyBench: Evaluating Creativity and Diversity in Language Models

要約 言語モデルは、標準のベンチマークで顕著な機能を実証していますが、モードの崩 … 続きを読む

カテゴリー: cs.CL | NoveltyBench: Evaluating Creativity and Diversity in Language Models はコメントを受け付けていません

DeepNote: Note-Centric Deep Retrieval-Augmented Generation

要約 検索された生成(RAG)は、外部の知識を組み込むことにより、質問回答(QA … 続きを読む

カテゴリー: cs.CL | DeepNote: Note-Centric Deep Retrieval-Augmented Generation はコメントを受け付けていません

LLM-based Automated Grading with Human-in-the-Loop

要約 人工知能(AI)技術の台頭、特に大規模な言語モデル(LLM)は、教育分野に … 続きを読む

カテゴリー: cs.CL | LLM-based Automated Grading with Human-in-the-Loop はコメントを受け付けていません

PrefRAG: Preference-Driven Multi-Source Retrieval Augmented Generation

要約 検索された生成(RAG)は、大規模な言語モデル(LLM)の幻覚の問題とパラ … 続きを読む

カテゴリー: cs.CL | PrefRAG: Preference-Driven Multi-Source Retrieval Augmented Generation はコメントを受け付けていません

Do PhD-level LLMs Truly Grasp Elementary Addition? Probing Rule Learning vs. Memorization in Large Language Models

要約 ベンチマークスコアが高いにもかかわらず、大規模な言語モデル(LLM)はしば … 続きを読む

カテゴリー: cs.CL | Do PhD-level LLMs Truly Grasp Elementary Addition? Probing Rule Learning vs. Memorization in Large Language Models はコメントを受け付けていません

Enhancing LLM-Based Short Answer Grading with Retrieval-Augmented Generation

要約 短い回答評価は科学教育の重要な要素であり、学生の複雑な3次元の理解を評価で … 続きを読む

カテゴリー: cs.CL | Enhancing LLM-Based Short Answer Grading with Retrieval-Augmented Generation はコメントを受け付けていません

PHEONA: An Evaluation Framework for Large Language Model-based Approaches to Computational Phenotyping

要約 計算表現型は生物医学の研究に不可欠ですが、特に従来の方法には一般的に広範な … 続きを読む

カテゴリー: cs.CL | PHEONA: An Evaluation Framework for Large Language Model-based Approaches to Computational Phenotyping はコメントを受け付けていません

Truthful or Fabricated? Using Causal Attribution to Mitigate Reward Hacking in Explanations

要約 鎖の説明は、大規模な言語モデル(LLM)の決定プロセスを検査し、モデル出力 … 続きを読む

カテゴリー: cs.CL | Truthful or Fabricated? Using Causal Attribution to Mitigate Reward Hacking in Explanations はコメントを受け付けていません

Explainable AI for Enhancing Efficiency of DL-based Channel Estimation

要約 人工知能(AI)ベースの意思決定のサポートは、将来の6Gネットワ​​ークの … 続きを読む

カテゴリー: cs.AI, eess.SP | Explainable AI for Enhancing Efficiency of DL-based Channel Estimation はコメントを受け付けていません

Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID

要約 熱赤外ビデオで複数の無人航空機(UAV)を検出および追跡することは、コント … 続きを読む

カテゴリー: cs.AI, cs.CV | Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID はコメントを受け付けていません