月別アーカイブ: 2025年3月

Got Compute, but No Data: Lessons From Post-training a Finnish LLM

要約 LLMSがチャットボットや一般的なアシスタントとしてより多くの人気を得るに … 続きを読む

カテゴリー: cs.CL | Got Compute, but No Data: Lessons From Post-training a Finnish LLM はコメントを受け付けていません

Towards Generating Automatic Anaphora Annotations

要約 さまざまなNLPタスクでうまく機能する可能性のあるトレーニングモデルには、 … 続きを読む

カテゴリー: cs.CL | Towards Generating Automatic Anaphora Annotations はコメントを受け付けていません

Florenz: Scaling Laws for Systematic Generalization in Vision-Language Models

要約 横断的転送により、ビジョン言語モデル(VLM)は、1つの言語でのみトレーニ … 続きを読む

カテゴリー: cs.CL, cs.LG | Florenz: Scaling Laws for Systematic Generalization in Vision-Language Models はコメントを受け付けていません

Explicit Learning and the LLM in Machine Translation

要約 この研究では、明示的な学習のための大規模な言語モデル(LLMS)の能力を調 … 続きを読む

カテゴリー: cs.CL | Explicit Learning and the LLM in Machine Translation はコメントを受け付けていません

BAMBI: Developing Baby Language Models for Italian

要約 このペーパーでは、5歳のイタリア語を話す子供が受け取った言語入力を模倣する … 続きを読む

カテゴリー: cs.CL | BAMBI: Developing Baby Language Models for Italian はコメントを受け付けていません

Finite State Automata Inside Transformers with Chain-of-Thought: A Mechanistic Study on State Tracking

要約 チェーンオブ思考(COT)は、幅広いタスクにわたって大規模な言語モデル(L … 続きを読む

カテゴリー: cs.CL, cs.LG | Finite State Automata Inside Transformers with Chain-of-Thought: A Mechanistic Study on State Tracking はコメントを受け付けていません

Independence Tests for Language Models

要約 次の問題を検討します。2つのモデルの重みを考えると、それらが独立して訓練さ … 続きを読む

カテゴリー: cs.CL, cs.LG | Independence Tests for Language Models はコメントを受け付けていません

TRACE: Real-Time Multimodal Common Ground Tracking in Situated Collaborative Dialogues

要約 実施された共同タスクでのライブ *共通の地面 *追跡のための新しいシステム … 続きを読む

カテゴリー: cs.CL | TRACE: Real-Time Multimodal Common Ground Tracking in Situated Collaborative Dialogues はコメントを受け付けていません

Reinforcement Learning is all You Need

要約 人間のフィードバックなしでの強化学習による推論におけるDeepseek R … 続きを読む

カテゴリー: cs.CL, cs.LG | Reinforcement Learning is all You Need はコメントを受け付けていません

SAEBench: A Comprehensive Benchmark for Sparse Autoencoders in Language Model Interpretability

要約 Sparse Autoencoders(SAE)は、言語モデルの活性化を解 … 続きを読む

カテゴリー: cs.CL, cs.LG | SAEBench: A Comprehensive Benchmark for Sparse Autoencoders in Language Model Interpretability はコメントを受け付けていません