「cs.CL」カテゴリーアーカイブ

TRIM: Token Reduction and Inference Modeling for Cost-Effective Language Generation

投稿日: 2024年12月19日作成者: jarxiv

要約大規模言語モデル (LLM) の推論コストは、特に長い出力を必要とするタス … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Domain-adaptative Continual Learning for Low-resource Tasks: Evaluation on Nepali

投稿日: 2024年12月19日作成者: jarxiv

要約新しいデータが利用可能になった場合に大規模言語モデル (LLM) をゼロか … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Energy-Based Preference Model Offers Better Offline Alignment than the Bradley-Terry Preference Model

投稿日: 2024年12月19日作成者: jarxiv

要約 DPO のデビュー以来、KL 制約付き RLHF 損失を介してターゲット … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Anchoring Bias in Large Language Models: An Experimental Study

投稿日: 2024年12月19日作成者: jarxiv

要約 GPT-4 や Gemini などの大規模言語モデル (LLM) は、機械 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Crabs: Consuming Resrouce via Auto-generation for LLM-DoS Attack under Black-box Settings

投稿日: 2024年12月19日作成者: jarxiv

要約大規模言語モデル (LLM) は、さまざまなタスクにわたって優れたパフォー … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR | コメントを受け付けていません

Understanding and Analyzing Model Robustness and Knowledge-Transfer in Multilingual Neural Machine Translation using TX-Ray

投稿日: 2024年12月19日作成者: jarxiv

要約ニューラルネットワークは、従来のフレーズベースのアプローチと比較して、ニ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

PersonaGym: Evaluating Persona Agents and LLMs

投稿日: 2024年12月19日作成者: jarxiv

要約ペルソナエージェントは、割り当てられたペルソナに従って動作する LLM … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Kalahi: A handcrafted, grassroots cultural LLM evaluation suite for Filipino

投稿日: 2024年12月19日作成者: jarxiv

要約今日の多言語大規模言語モデル (LLM) は、フィリピン人ユーザーに対して … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

TimeCMA: Towards LLM-Empowered Multivariate Time Series Forecasting via Cross-Modality Alignment

投稿日: 2024年12月19日作成者: jarxiv

要約多変量時系列予測 (MTSF) は、変数間の時間的ダイナミクスを学習して将 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Pipeline Analysis for Developing Instruct LLMs in Low-Resource Languages: A Case Study on Basque

投稿日: 2024年12月19日作成者: jarxiv

要約大規模言語モデル (LLM) は通常、英語などのリソースが豊富な言語に最適 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

TRIM: Token Reduction and Inference Modeling for Cost-Effective Language Generation

Domain-adaptative Continual Learning for Low-resource Tasks: Evaluation on Nepali

Energy-Based Preference Model Offers Better Offline Alignment than the Bradley-Terry Preference Model

Anchoring Bias in Large Language Models: An Experimental Study

Crabs: Consuming Resrouce via Auto-generation for LLM-DoS Attack under Black-box Settings

Understanding and Analyzing Model Robustness and Knowledge-Transfer in Multilingual Neural Machine Translation using TX-Ray

PersonaGym: Evaluating Persona Agents and LLMs

Kalahi: A handcrafted, grassroots cultural LLM evaluation suite for Filipino

TimeCMA: Towards LLM-Empowered Multivariate Time Series Forecasting via Cross-Modality Alignment

Pipeline Analysis for Developing Instruct LLMs in Low-Resource Languages: A Case Study on Basque

最近の投稿

最近のコメント

アーカイブ

カテゴリー