月別アーカイブ: 2024年9月

MedFuzz: Exploring the Robustness of Large Language Models in Medical Question Answering

要約 大規模言語モデル(LLM)は、医学的な質問応答ベンチマークにおいて目覚まし … 続きを読む

カテゴリー: cs.CL, cs.LG, I.2.7 | MedFuzz: Exploring the Robustness of Large Language Models in Medical Question Answering はコメントを受け付けていません

REBEL: Reinforcement Learning via Regressing Relative Rewards

要約 プロキシマル・ポリシー最適化(PPO)は、元々は連続制御問題のために開発さ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | REBEL: Reinforcement Learning via Regressing Relative Rewards はコメントを受け付けていません

Dynamic Boundary Time Warping for Sub-sequence Matching with Few Examples

要約 本論文では、長い時間的配列の中から、短い配列の集合に類似した断片を見つける … 続きを読む

カテゴリー: cs.CL, cs.DS, cs.IR | Dynamic Boundary Time Warping for Sub-sequence Matching with Few Examples はコメントを受け付けていません

CMAT: A Multi-Agent Collaboration Tuning Framework for Enhancing Small Language Models

要約 オープンな大規模言語モデル(LLM)は、自然言語処理の分野を大きく発展させ … 続きを読む

カテゴリー: cs.CL | CMAT: A Multi-Agent Collaboration Tuning Framework for Enhancing Small Language Models はコメントを受け付けていません

From Wide to Deep: Dimension Lifting Network for Parameter-efficient Knowledge Graph Embedding

要約 実体と関係をベクトル表現にマッピングする知識グラフ埋め込み(KGE)は、下 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | From Wide to Deep: Dimension Lifting Network for Parameter-efficient Knowledge Graph Embedding はコメントを受け付けていません

Cultural Compass: Predicting Transfer Learning Success in Offensive Language Detection with Cultural Features

要約 言語技術のユビキタス化に伴い、機械学習領域における文化的多様性を考慮する方 … 続きを読む

カテゴリー: cs.CL | Cultural Compass: Predicting Transfer Learning Success in Offensive Language Detection with Cultural Features はコメントを受け付けていません

Persuasion Games using Large Language Models

要約 大規模言語モデル(LLM)は、人間のようなテキストを理解し、生成することが … 続きを読む

カテゴリー: cs.AI, cs.CL | Persuasion Games using Large Language Models はコメントを受け付けていません

MM-Soc: Benchmarking Multimodal Large Language Models in Social Media Platforms

要約 ソーシャルメディア・プラットフォームは、テキスト、画像、動画を含むマルチモ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.CY | MM-Soc: Benchmarking Multimodal Large Language Models in Social Media Platforms はコメントを受け付けていません

ACORN: Aspect-wise Commonsense Reasoning Explanation Evaluation

要約 フリーテキストの説明の質を評価することは、多面的で主観的、かつ手間のかかる … 続きを読む

カテゴリー: cs.CL | ACORN: Aspect-wise Commonsense Reasoning Explanation Evaluation はコメントを受け付けていません

CHiSafetyBench: A Chinese Hierarchical Safety Benchmark for Large Language Models

要約 大規模言語モデル(LLM)の急速な発展に伴い、その安全性への関心が高まって … 続きを読む

カテゴリー: cs.AI, cs.CL | CHiSafetyBench: A Chinese Hierarchical Safety Benchmark for Large Language Models はコメントを受け付けていません