cs.LG」カテゴリーアーカイブ

Efficiently Escaping Saddle Points under Generalized Smoothness via Self-Bounding Regularity

要約 この論文では、一次方法を使用して必ずしもスムーズではない機能に関する非凸最 … 続きを読む

カテゴリー: cs.LG, math.OC | Efficiently Escaping Saddle Points under Generalized Smoothness via Self-Bounding Regularity はコメントを受け付けていません

AfroBench: How Good are Large Language Models on African Languages?

要約 メガなどの大規模な多言語評価には、高品質の評価データが不足しているため、既 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | AfroBench: How Good are Large Language Models on African Languages? はコメントを受け付けていません

Generalized Interpolating Discrete Diffusion

要約 最先端の言語モデルは次のトークン予測を通じて印象的な結果を達成しますが、す … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Generalized Interpolating Discrete Diffusion はコメントを受け付けていません

Procedural Knowledge in Pretraining Drives Reasoning in Large Language Models

要約 大規模な言語モデルの機能と制限は、近年、非常に詳細にスケッチされており、興 … 続きを読む

カテゴリー: cs.CL, cs.LG | Procedural Knowledge in Pretraining Drives Reasoning in Large Language Models はコメントを受け付けていません

An Information-theoretic Multi-task Representation Learning Framework for Natural Language Understanding

要約 このペーパーでは、すべてのタスクに対してノイズ不変の表現を抽出するための新 … 続きを読む

カテゴリー: cs.CL, cs.IT, cs.LG, math.IT | An Information-theoretic Multi-task Representation Learning Framework for Natural Language Understanding はコメントを受け付けていません

STX-Search: Explanation Search for Continuous Dynamic Spatio-Temporal Models

要約 時空モデルの表現力の最近の改善により、トラフィック予測やソーシャルネットワ … 続きを読む

カテゴリー: cs.AI, cs.LG | STX-Search: Explanation Search for Continuous Dynamic Spatio-Temporal Models はコメントを受け付けていません

Gumbel Counterfactual Generation From Language Models

要約 言語モデルの因果生成メカニズムを理解し、操作することは、その行動を制御する … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Gumbel Counterfactual Generation From Language Models はコメントを受け付けていません

On the Challenges and Opportunities in Generative AI

要約 深い生成モデリングの分野は、ここ数年で急速に成長しました。 膨大な量のトレ … 続きを読む

カテゴリー: cs.AI, cs.LG | On the Challenges and Opportunities in Generative AI はコメントを受け付けていません

Graph Neural Networks for Virtual Sensing in Complex Systems: Addressing Heterogeneous Temporal Dynamics

要約 複雑なシステムの信頼性が高く効率的な動作には、リアルタイムの状態監視が重要 … 続きを読む

カテゴリー: cs.AI, cs.CE, cs.LG | Graph Neural Networks for Virtual Sensing in Complex Systems: Addressing Heterogeneous Temporal Dynamics はコメントを受け付けていません

Compositional Causal Reasoning Evaluation in Language Models

要約 因果的推論と構成の推論は、生成AIの2つの中核となる願望です。 これらの動 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Compositional Causal Reasoning Evaluation in Language Models はコメントを受け付けていません