cs.CL」カテゴリーアーカイブ

Explicit Learning and the LLM in Machine Translation

要約 この研究では、明示的な学習のための大規模な言語モデル(LLMS)の能力を調 … 続きを読む

カテゴリー: cs.CL | Explicit Learning and the LLM in Machine Translation はコメントを受け付けていません

BAMBI: Developing Baby Language Models for Italian

要約 このペーパーでは、5歳のイタリア語を話す子供が受け取った言語入力を模倣する … 続きを読む

カテゴリー: cs.CL | BAMBI: Developing Baby Language Models for Italian はコメントを受け付けていません

Finite State Automata Inside Transformers with Chain-of-Thought: A Mechanistic Study on State Tracking

要約 チェーンオブ思考(COT)は、幅広いタスクにわたって大規模な言語モデル(L … 続きを読む

カテゴリー: cs.CL, cs.LG | Finite State Automata Inside Transformers with Chain-of-Thought: A Mechanistic Study on State Tracking はコメントを受け付けていません

Independence Tests for Language Models

要約 次の問題を検討します。2つのモデルの重みを考えると、それらが独立して訓練さ … 続きを読む

カテゴリー: cs.CL, cs.LG | Independence Tests for Language Models はコメントを受け付けていません

TRACE: Real-Time Multimodal Common Ground Tracking in Situated Collaborative Dialogues

要約 実施された共同タスクでのライブ *共通の地面 *追跡のための新しいシステム … 続きを読む

カテゴリー: cs.CL | TRACE: Real-Time Multimodal Common Ground Tracking in Situated Collaborative Dialogues はコメントを受け付けていません

Reinforcement Learning is all You Need

要約 人間のフィードバックなしでの強化学習による推論におけるDeepseek R … 続きを読む

カテゴリー: cs.CL, cs.LG | Reinforcement Learning is all You Need はコメントを受け付けていません

SAEBench: A Comprehensive Benchmark for Sparse Autoencoders in Language Model Interpretability

要約 Sparse Autoencoders(SAE)は、言語モデルの活性化を解 … 続きを読む

カテゴリー: cs.CL, cs.LG | SAEBench: A Comprehensive Benchmark for Sparse Autoencoders in Language Model Interpretability はコメントを受け付けていません

Prompt Engineering Using GPT for Word-Level Code-Mixed Language Identification in Low-Resource Dravidian Languages

要約 言語識別(LI)は、さまざまな自然言語処理タスクにとって重要であり、感情分 … 続きを読む

カテゴリー: cs.CL | Prompt Engineering Using GPT for Word-Level Code-Mixed Language Identification in Low-Resource Dravidian Languages はコメントを受け付けていません

PolyPythias: Stability and Outliers across Fifty Language Model Pre-Training Runs

要約 言語モデルの安定性トレーニング前の安定性とダウンストリームパフォーマンスへ … 続きを読む

カテゴリー: cs.CL, cs.LG | PolyPythias: Stability and Outliers across Fifty Language Model Pre-Training Runs はコメントを受け付けていません

Plan-and-Act: Improving Planning of Agents for Long-Horizon Tasks

要約 大規模な言語モデル(LLM)は、言語エージェントが簡単なタスクに取り組むこ … 続きを読む

カテゴリー: cs.CL | Plan-and-Act: Improving Planning of Agents for Long-Horizon Tasks はコメントを受け付けていません