投稿者「jarxiv」のアーカイブ

NoveltyBench: Evaluating Creativity and Diversity in Language Models

投稿日: 2025年4月8日作成者: jarxiv

要約言語モデルは、標準のベンチマークで顕著な機能を実証していますが、モードの崩 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

DeepNote: Note-Centric Deep Retrieval-Augmented Generation

投稿日: 2025年4月8日作成者: jarxiv

要約検索された生成（RAG）は、外部の知識を組み込むことにより、質問回答（QA … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

LLM-based Automated Grading with Human-in-the-Loop

投稿日: 2025年4月8日作成者: jarxiv

要約人工知能（AI）技術の台頭、特に大規模な言語モデル（LLM）は、教育分野に … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

PrefRAG: Preference-Driven Multi-Source Retrieval Augmented Generation

投稿日: 2025年4月8日作成者: jarxiv

要約検索された生成（RAG）は、大規模な言語モデル（LLM）の幻覚の問題とパラ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Do PhD-level LLMs Truly Grasp Elementary Addition? Probing Rule Learning vs. Memorization in Large Language Models

投稿日: 2025年4月8日作成者: jarxiv

要約ベンチマークスコアが高いにもかかわらず、大規模な言語モデル（LLM）はしば … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Enhancing LLM-Based Short Answer Grading with Retrieval-Augmented Generation

投稿日: 2025年4月8日作成者: jarxiv

要約短い回答評価は科学教育の重要な要素であり、学生の複雑な3次元の理解を評価で … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

PHEONA: An Evaluation Framework for Large Language Model-based Approaches to Computational Phenotyping

投稿日: 2025年4月8日作成者: jarxiv

要約計算表現型は生物医学の研究に不可欠ですが、特に従来の方法には一般的に広範な … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Truthful or Fabricated? Using Causal Attribution to Mitigate Reward Hacking in Explanations

投稿日: 2025年4月8日作成者: jarxiv

要約鎖の説明は、大規模な言語モデル（LLM）の決定プロセスを検査し、モデル出力 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Explainable AI for Enhancing Efficiency of DL-based Channel Estimation

投稿日: 2025年4月8日作成者: jarxiv

要約人工知能（AI）ベースの意思決定のサポートは、将来の6Gネットワークの … 続きを読む →

カテゴリー: cs.AI, eess.SP | コメントを受け付けていません

Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID

投稿日: 2025年4月8日作成者: jarxiv

要約熱赤外ビデオで複数の無人航空機（UAV）を検出および追跡することは、コント … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

NoveltyBench: Evaluating Creativity and Diversity in Language Models

DeepNote: Note-Centric Deep Retrieval-Augmented Generation

LLM-based Automated Grading with Human-in-the-Loop

PrefRAG: Preference-Driven Multi-Source Retrieval Augmented Generation

Do PhD-level LLMs Truly Grasp Elementary Addition? Probing Rule Learning vs. Memorization in Large Language Models

Enhancing LLM-Based Short Answer Grading with Retrieval-Augmented Generation

PHEONA: An Evaluation Framework for Large Language Model-based Approaches to Computational Phenotyping

Truthful or Fabricated? Using Causal Attribution to Mitigate Reward Hacking in Explanations

Explainable AI for Enhancing Efficiency of DL-based Channel Estimation

Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID

最近の投稿

最近のコメント

アーカイブ

カテゴリー