月別アーカイブ: 2025年3月

Got Compute, but No Data: Lessons From Post-training a Finnish LLM

投稿日: 2025年3月13日作成者: jarxiv

要約 LLMSがチャットボットや一般的なアシスタントとしてより多くの人気を得るに … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Towards Generating Automatic Anaphora Annotations

投稿日: 2025年3月13日作成者: jarxiv

要約さまざまなNLPタスクでうまく機能する可能性のあるトレーニングモデルには、 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Florenz: Scaling Laws for Systematic Generalization in Vision-Language Models

投稿日: 2025年3月13日作成者: jarxiv

要約横断的転送により、ビジョン言語モデル（VLM）は、1つの言語でのみトレーニ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Explicit Learning and the LLM in Machine Translation

投稿日: 2025年3月13日作成者: jarxiv

要約この研究では、明示的な学習のための大規模な言語モデル（LLMS）の能力を調 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

BAMBI: Developing Baby Language Models for Italian

投稿日: 2025年3月13日作成者: jarxiv

要約このペーパーでは、5歳のイタリア語を話す子供が受け取った言語入力を模倣する … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Finite State Automata Inside Transformers with Chain-of-Thought: A Mechanistic Study on State Tracking

投稿日: 2025年3月13日作成者: jarxiv

要約チェーンオブ思考（COT）は、幅広いタスクにわたって大規模な言語モデル（L … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Independence Tests for Language Models

投稿日: 2025年3月13日作成者: jarxiv

要約次の問題を検討します。2つのモデルの重みを考えると、それらが独立して訓練さ … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

TRACE: Real-Time Multimodal Common Ground Tracking in Situated Collaborative Dialogues

投稿日: 2025年3月13日作成者: jarxiv

要約実施された共同タスクでのライブ *共通の地面 *追跡のための新しいシステム … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Reinforcement Learning is all You Need

投稿日: 2025年3月13日作成者: jarxiv

要約人間のフィードバックなしでの強化学習による推論におけるDeepseek R … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

SAEBench: A Comprehensive Benchmark for Sparse Autoencoders in Language Model Interpretability

投稿日: 2025年3月13日作成者: jarxiv

要約 Sparse Autoencoders（SAE）は、言語モデルの活性化を解 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

月別アーカイブ: 2025年3月

Got Compute, but No Data: Lessons From Post-training a Finnish LLM

Towards Generating Automatic Anaphora Annotations

Florenz: Scaling Laws for Systematic Generalization in Vision-Language Models

Explicit Learning and the LLM in Machine Translation

BAMBI: Developing Baby Language Models for Italian

Finite State Automata Inside Transformers with Chain-of-Thought: A Mechanistic Study on State Tracking

Independence Tests for Language Models

TRACE: Real-Time Multimodal Common Ground Tracking in Situated Collaborative Dialogues

Reinforcement Learning is all You Need

SAEBench: A Comprehensive Benchmark for Sparse Autoencoders in Language Model Interpretability

最近の投稿

最近のコメント

アーカイブ

カテゴリー