「cs.CL」カテゴリーアーカイブ

Explicit Learning and the LLM in Machine Translation

投稿日: 2025年3月13日作成者: jarxiv

要約この研究では、明示的な学習のための大規模な言語モデル（LLMS）の能力を調 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

BAMBI: Developing Baby Language Models for Italian

投稿日: 2025年3月13日作成者: jarxiv

要約このペーパーでは、5歳のイタリア語を話す子供が受け取った言語入力を模倣する … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Finite State Automata Inside Transformers with Chain-of-Thought: A Mechanistic Study on State Tracking

投稿日: 2025年3月13日作成者: jarxiv

要約チェーンオブ思考（COT）は、幅広いタスクにわたって大規模な言語モデル（L … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Independence Tests for Language Models

投稿日: 2025年3月13日作成者: jarxiv

要約次の問題を検討します。2つのモデルの重みを考えると、それらが独立して訓練さ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

TRACE: Real-Time Multimodal Common Ground Tracking in Situated Collaborative Dialogues

投稿日: 2025年3月13日作成者: jarxiv

要約実施された共同タスクでのライブ *共通の地面 *追跡のための新しいシステム … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Reinforcement Learning is all You Need

投稿日: 2025年3月13日作成者: jarxiv

要約人間のフィードバックなしでの強化学習による推論におけるDeepseek R … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

SAEBench: A Comprehensive Benchmark for Sparse Autoencoders in Language Model Interpretability

投稿日: 2025年3月13日作成者: jarxiv

要約 Sparse Autoencoders（SAE）は、言語モデルの活性化を解 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Prompt Engineering Using GPT for Word-Level Code-Mixed Language Identification in Low-Resource Dravidian Languages

投稿日: 2025年3月13日作成者: jarxiv

要約言語識別（LI）は、さまざまな自然言語処理タスクにとって重要であり、感情分 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

PolyPythias: Stability and Outliers across Fifty Language Model Pre-Training Runs

投稿日: 2025年3月13日作成者: jarxiv

要約言語モデルの安定性トレーニング前の安定性とダウンストリームパフォーマンスへ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Plan-and-Act: Improving Planning of Agents for Long-Horizon Tasks

投稿日: 2025年3月13日作成者: jarxiv

要約大規模な言語モデル（LLM）は、言語エージェントが簡単なタスクに取り組むこ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

Explicit Learning and the LLM in Machine Translation

BAMBI: Developing Baby Language Models for Italian

Finite State Automata Inside Transformers with Chain-of-Thought: A Mechanistic Study on State Tracking

Independence Tests for Language Models

TRACE: Real-Time Multimodal Common Ground Tracking in Situated Collaborative Dialogues

Reinforcement Learning is all You Need

SAEBench: A Comprehensive Benchmark for Sparse Autoencoders in Language Model Interpretability

Prompt Engineering Using GPT for Word-Level Code-Mixed Language Identification in Low-Resource Dravidian Languages

PolyPythias: Stability and Outliers across Fifty Language Model Pre-Training Runs

Plan-and-Act: Improving Planning of Agents for Long-Horizon Tasks

最近の投稿

最近のコメント

アーカイブ

カテゴリー