cs.CL」カテゴリーアーカイブ

Linear-time Minimum Bayes Risk Decoding with Reference Aggregation

要約 最小ベイズリスク(MBR)復号は、機械翻訳の品質を向上させることが示されて … 続きを読む

カテゴリー: cs.CL | Linear-time Minimum Bayes Risk Decoding with Reference Aggregation はコメントを受け付けていません

Split and Rephrase with Large Language Models

要約 SPRP(Split and Rephrase)タスクは、複雑な文章を、元 … 続きを読む

カテゴリー: cs.CL | Split and Rephrase with Large Language Models はコメントを受け付けていません

Representation Surgery: Theory and Practice of Affine Steering

要約 言語モデルは、有害なテキストや性別に偏ったテキストを生成するなど、望ましく … 続きを読む

カテゴリー: cs.CL, cs.CY, cs.LG | Representation Surgery: Theory and Practice of Affine Steering はコメントを受け付けていません

SyntaxShap: Syntax-aware Explainability Method for Text Generation

要約 セーフティ・クリティカルな領域で大規模言語モデルの能力を活用するためには、 … 続きを読む

カテゴリー: cs.AI, cs.CL | SyntaxShap: Syntax-aware Explainability Method for Text Generation はコメントを受け付けていません

Balancing Speciality and Versatility: a Coarse to Fine Framework for Supervised Fine-tuning Large Language Model

要約 整列された大規模言語モデル(LLM)は、実世界の様々なタスクを処理すること … 続きを読む

カテゴリー: cs.CL | Balancing Speciality and Versatility: a Coarse to Fine Framework for Supervised Fine-tuning Large Language Model はコメントを受け付けていません

OpenToM: A Comprehensive Benchmark for Evaluating Theory-of-Mind Reasoning Capabilities of Large Language Models

要約 ニューラル・セオリー・オブ・マインド(N-ToM)は、機械が他者の心理状態 … 続きを読む

カテゴリー: cs.AI, cs.CL | OpenToM: A Comprehensive Benchmark for Evaluating Theory-of-Mind Reasoning Capabilities of Large Language Models はコメントを受け付けていません

PRE: A Peer Review Based Large Language Model Evaluator

要約 大規模言語モデル(LLM)の優れた性能は、学術界や産業界から大きな注目を集 … 続きを読む

カテゴリー: cs.CL, cs.IR | PRE: A Peer Review Based Large Language Model Evaluator はコメントを受け付けていません

Planning, Creation, Usage: Benchmarking LLMs for Comprehensive Tool Utilization in Real-World Complex Scenarios

要約 大規模言語モデル(LLM)を実世界のアプリケーションでツールエージェントと … 続きを読む

カテゴリー: cs.CL | Planning, Creation, Usage: Benchmarking LLMs for Comprehensive Tool Utilization in Real-World Complex Scenarios はコメントを受け付けていません

Adversarial Preference Optimization: Enhancing Your Alignment via RM-LLM Game

要約 大規模言語モデル(LLM)の対話品質を向上させるためには、人間の嗜好アライ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Adversarial Preference Optimization: Enhancing Your Alignment via RM-LLM Game はコメントを受け付けていません

Revisiting Code Similarity Evaluation with Abstract Syntax Tree Edit Distance

要約 本稿では、最近のコード類似性評価メトリクスを再検討し、特に、多様なプログラ … 続きを読む

カテゴリー: cs.CL, cs.PL, cs.SE | Revisiting Code Similarity Evaluation with Abstract Syntax Tree Edit Distance はコメントを受け付けていません