月別アーカイブ: 2024年6月

Benchmark Data Contamination of Large Language Models: A Survey

要約 GPT-4、Claude-3、Gemini などの大規模言語モデル (LL … 続きを読む

カテゴリー: cs.CL | Benchmark Data Contamination of Large Language Models: A Survey はコメントを受け付けていません

Reflect-RL: Two-Player Online RL Fine-Tuning for LMs

要約 言語モデル (LM) がさまざまな分野でその機能を実証するにつれて、マルチ … 続きを読む

カテゴリー: cs.CL, cs.LG | Reflect-RL: Two-Player Online RL Fine-Tuning for LMs はコメントを受け付けていません

Transformers need glasses! Information over-squashing in language tasks

要約 私たちは、ほとんどの既存のフロンティア大規模言語モデル (LLM) のアー … 続きを読む

カテゴリー: cs.CL, cs.LG | Transformers need glasses! Information over-squashing in language tasks はコメントを受け付けていません

Buffer of Thoughts: Thought-Augmented Reasoning with Large Language Models

要約 大規模言語モデル (LLM) の精度、効率、堅牢性を向上させるための、斬新 … 続きを読む

カテゴリー: cs.CL | Buffer of Thoughts: Thought-Augmented Reasoning with Large Language Models はコメントを受け付けていません

Characterizing Similarities and Divergences in Conversational Tones in Humans and LLMs by Sampling with People

要約 会話のトーン、つまり話者がコミュニケーションをとる際のマナーや態度は、効果 … 続きを読む

カテゴリー: cs.CL, cs.HC | Characterizing Similarities and Divergences in Conversational Tones in Humans and LLMs by Sampling with People はコメントを受け付けていません

What Languages are Easy to Language-Model? A Perspective from Learning Probabilistic Regular Languages

要約 大規模な言語モデルは何を学習できるのでしょうか? 定義上、言語モデル (L … 続きを読む

カテゴリー: cs.CL | What Languages are Easy to Language-Model? A Perspective from Learning Probabilistic Regular Languages はコメントを受け付けていません

LiveCodeBench: Holistic and Contamination Free Evaluation of Large Language Models for Code

要約 コード関連のアプリケーションに適用される大規模言語モデル (LLM) は、 … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SE | LiveCodeBench: Holistic and Contamination Free Evaluation of Large Language Models for Code はコメントを受け付けていません

Measuring and Addressing Indexical Bias in Information Retrieval

要約 情報検索 (IR) システムは、関連するコンテンツを配信するように設計され … 続きを読む

カテゴリー: cs.CL, cs.IR | Measuring and Addressing Indexical Bias in Information Retrieval はコメントを受け付けていません

Don’t Rank, Combine! Combining Machine Translation Hypotheses Using Quality Estimation

要約 ニューラル機械翻訳システムは、ソース文が与えられた場合にターゲット文の確率 … 続きを読む

カテゴリー: cs.CL, cs.LG | Don’t Rank, Combine! Combining Machine Translation Hypotheses Using Quality Estimation はコメントを受け付けていません

Redundancy-aware Action Spaces for Robot Learning

要約 関節空間制御とタスク空間制御は、ロボット学習文献の中でロボット アームを制 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Redundancy-aware Action Spaces for Robot Learning はコメントを受け付けていません