cs.CL」カテゴリーアーカイブ

TRIM: Token Reduction and Inference Modeling for Cost-Effective Language Generation

要約 大規模言語モデル (LLM) の推論コストは、特に長い出力を必要とするタス … 続きを読む

カテゴリー: cs.CL | TRIM: Token Reduction and Inference Modeling for Cost-Effective Language Generation はコメントを受け付けていません

Domain-adaptative Continual Learning for Low-resource Tasks: Evaluation on Nepali

要約 新しいデータが利用可能になった場合に大規模言語モデル (LLM) をゼロか … 続きを読む

カテゴリー: cs.CL, cs.LG | Domain-adaptative Continual Learning for Low-resource Tasks: Evaluation on Nepali はコメントを受け付けていません

Energy-Based Preference Model Offers Better Offline Alignment than the Bradley-Terry Preference Model

要約 DPO のデビュー以来、KL 制約付き RLHF 損失を介してターゲット … 続きを読む

カテゴリー: cs.CL, cs.LG | Energy-Based Preference Model Offers Better Offline Alignment than the Bradley-Terry Preference Model はコメントを受け付けていません

Anchoring Bias in Large Language Models: An Experimental Study

要約 GPT-4 や Gemini などの大規模言語モデル (LLM) は、機械 … 続きを読む

カテゴリー: cs.CL | Anchoring Bias in Large Language Models: An Experimental Study はコメントを受け付けていません

Crabs: Consuming Resrouce via Auto-generation for LLM-DoS Attack under Black-box Settings

要約 大規模言語モデル (LLM) は、さまざまなタスクにわたって優れたパフォー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR | Crabs: Consuming Resrouce via Auto-generation for LLM-DoS Attack under Black-box Settings はコメントを受け付けていません

Understanding and Analyzing Model Robustness and Knowledge-Transfer in Multilingual Neural Machine Translation using TX-Ray

要約 ニューラル ネットワークは、従来のフレーズベースのアプローチと比較して、ニ … 続きを読む

カテゴリー: cs.AI, cs.CL | Understanding and Analyzing Model Robustness and Knowledge-Transfer in Multilingual Neural Machine Translation using TX-Ray はコメントを受け付けていません

PersonaGym: Evaluating Persona Agents and LLMs

要約 ペルソナ エージェントは、割り当てられたペルソナに従って動作する LLM … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | PersonaGym: Evaluating Persona Agents and LLMs はコメントを受け付けていません

Kalahi: A handcrafted, grassroots cultural LLM evaluation suite for Filipino

要約 今日の多言語大規模言語モデル (LLM) は、フィリピン人ユーザーに対して … 続きを読む

カテゴリー: cs.AI, cs.CL | Kalahi: A handcrafted, grassroots cultural LLM evaluation suite for Filipino はコメントを受け付けていません

TimeCMA: Towards LLM-Empowered Multivariate Time Series Forecasting via Cross-Modality Alignment

要約 多変量時系列予測 (MTSF) は、変数間の時間的ダイナミクスを学習して将 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | TimeCMA: Towards LLM-Empowered Multivariate Time Series Forecasting via Cross-Modality Alignment はコメントを受け付けていません

Pipeline Analysis for Developing Instruct LLMs in Low-Resource Languages: A Case Study on Basque

要約 大規模言語モデル (LLM) は通常、英語などのリソースが豊富な言語に最適 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Pipeline Analysis for Developing Instruct LLMs in Low-Resource Languages: A Case Study on Basque はコメントを受け付けていません