「cs.CL」カテゴリーアーカイブ

Linear-time Minimum Bayes Risk Decoding with Reference Aggregation

投稿日: 2024年6月4日作成者: jarxiv

要約最小ベイズリスク（MBR）復号は、機械翻訳の品質を向上させることが示されて … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Split and Rephrase with Large Language Models

投稿日: 2024年6月4日作成者: jarxiv

要約 SPRP（Split and Rephrase）タスクは、複雑な文章を、元 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Representation Surgery: Theory and Practice of Affine Steering

投稿日: 2024年6月4日作成者: jarxiv

要約言語モデルは、有害なテキストや性別に偏ったテキストを生成するなど、望ましく … 続きを読む →

カテゴリー: cs.CL, cs.CY, cs.LG | コメントを受け付けていません

SyntaxShap: Syntax-aware Explainability Method for Text Generation

投稿日: 2024年6月4日作成者: jarxiv

要約セーフティ・クリティカルな領域で大規模言語モデルの能力を活用するためには、 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Balancing Speciality and Versatility: a Coarse to Fine Framework for Supervised Fine-tuning Large Language Model

投稿日: 2024年6月4日作成者: jarxiv

要約整列された大規模言語モデル(LLM)は、実世界の様々なタスクを処理すること … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

OpenToM: A Comprehensive Benchmark for Evaluating Theory-of-Mind Reasoning Capabilities of Large Language Models

投稿日: 2024年6月4日作成者: jarxiv

要約ニューラル・セオリー・オブ・マインド(N-ToM)は、機械が他者の心理状態 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

PRE: A Peer Review Based Large Language Model Evaluator

投稿日: 2024年6月4日作成者: jarxiv

要約大規模言語モデル（LLM）の優れた性能は、学術界や産業界から大きな注目を集 … 続きを読む →

カテゴリー: cs.CL, cs.IR | コメントを受け付けていません

Planning, Creation, Usage: Benchmarking LLMs for Comprehensive Tool Utilization in Real-World Complex Scenarios

投稿日: 2024年6月4日作成者: jarxiv

要約大規模言語モデル（LLM）を実世界のアプリケーションでツールエージェントと … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Adversarial Preference Optimization: Enhancing Your Alignment via RM-LLM Game

投稿日: 2024年6月4日作成者: jarxiv

要約大規模言語モデル（LLM）の対話品質を向上させるためには、人間の嗜好アライ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Revisiting Code Similarity Evaluation with Abstract Syntax Tree Edit Distance

投稿日: 2024年6月4日作成者: jarxiv

要約本稿では、最近のコード類似性評価メトリクスを再検討し、特に、多様なプログラ … 続きを読む →

カテゴリー: cs.CL, cs.PL, cs.SE | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

Linear-time Minimum Bayes Risk Decoding with Reference Aggregation

Split and Rephrase with Large Language Models

Representation Surgery: Theory and Practice of Affine Steering

SyntaxShap: Syntax-aware Explainability Method for Text Generation

Balancing Speciality and Versatility: a Coarse to Fine Framework for Supervised Fine-tuning Large Language Model

OpenToM: A Comprehensive Benchmark for Evaluating Theory-of-Mind Reasoning Capabilities of Large Language Models

PRE: A Peer Review Based Large Language Model Evaluator

Planning, Creation, Usage: Benchmarking LLMs for Comprehensive Tool Utilization in Real-World Complex Scenarios

Adversarial Preference Optimization: Enhancing Your Alignment via RM-LLM Game

Revisiting Code Similarity Evaluation with Abstract Syntax Tree Edit Distance

最近の投稿

最近のコメント

アーカイブ

カテゴリー