月別アーカイブ: 2024年6月

SyntaxShap: Syntax-aware Explainability Method for Text Generation

要約 セーフティ・クリティカルな領域で大規模言語モデルの能力を活用するためには、 … 続きを読む

カテゴリー: cs.AI, cs.CL | SyntaxShap: Syntax-aware Explainability Method for Text Generation はコメントを受け付けていません

Balancing Speciality and Versatility: a Coarse to Fine Framework for Supervised Fine-tuning Large Language Model

要約 整列された大規模言語モデル(LLM)は、実世界の様々なタスクを処理すること … 続きを読む

カテゴリー: cs.CL | Balancing Speciality and Versatility: a Coarse to Fine Framework for Supervised Fine-tuning Large Language Model はコメントを受け付けていません

OpenToM: A Comprehensive Benchmark for Evaluating Theory-of-Mind Reasoning Capabilities of Large Language Models

要約 ニューラル・セオリー・オブ・マインド(N-ToM)は、機械が他者の心理状態 … 続きを読む

カテゴリー: cs.AI, cs.CL | OpenToM: A Comprehensive Benchmark for Evaluating Theory-of-Mind Reasoning Capabilities of Large Language Models はコメントを受け付けていません

PRE: A Peer Review Based Large Language Model Evaluator

要約 大規模言語モデル(LLM)の優れた性能は、学術界や産業界から大きな注目を集 … 続きを読む

カテゴリー: cs.CL, cs.IR | PRE: A Peer Review Based Large Language Model Evaluator はコメントを受け付けていません

Planning, Creation, Usage: Benchmarking LLMs for Comprehensive Tool Utilization in Real-World Complex Scenarios

要約 大規模言語モデル(LLM)を実世界のアプリケーションでツールエージェントと … 続きを読む

カテゴリー: cs.CL | Planning, Creation, Usage: Benchmarking LLMs for Comprehensive Tool Utilization in Real-World Complex Scenarios はコメントを受け付けていません

Adversarial Preference Optimization: Enhancing Your Alignment via RM-LLM Game

要約 大規模言語モデル(LLM)の対話品質を向上させるためには、人間の嗜好アライ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Adversarial Preference Optimization: Enhancing Your Alignment via RM-LLM Game はコメントを受け付けていません

Revisiting Code Similarity Evaluation with Abstract Syntax Tree Edit Distance

要約 本稿では、最近のコード類似性評価メトリクスを再検討し、特に、多様なプログラ … 続きを読む

カテゴリー: cs.CL, cs.PL, cs.SE | Revisiting Code Similarity Evaluation with Abstract Syntax Tree Edit Distance はコメントを受け付けていません

Can LLMs Separate Instructions From Data? And What Do We Even Mean By That?

要約 命令チューニングされた大規模言語モデル(LLM)は、多くの実用的なアプリケ … 続きを読む

カテゴリー: cs.CL, cs.LG | Can LLMs Separate Instructions From Data? And What Do We Even Mean By That? はコメントを受け付けていません

Benchmarking and Improving Compositional Generalization of Multi-aspect Controllable Text Generation

要約 構文汎化とは、学習データから単一の属性を組み換えることによって得られる新し … 続きを読む

カテゴリー: cs.CL | Benchmarking and Improving Compositional Generalization of Multi-aspect Controllable Text Generation はコメントを受け付けていません

LangBridge: Multilingual Reasoning Without Multilingual Supervision

要約 我々はLangBridgeを紹介する。LangBridgeは、多言語監督な … 続きを読む

カテゴリー: cs.CL | LangBridge: Multilingual Reasoning Without Multilingual Supervision はコメントを受け付けていません