cs.LG」カテゴリーアーカイブ

Is Adversarial Training with Compressed Datasets Effective?

要約 データセット凝縮(DC)は、より大きなデータセットから小さく、合成のデータ … 続きを読む

カテゴリー: cs.LG | Is Adversarial Training with Compressed Datasets Effective? はコメントを受け付けていません

Understanding Virtual Nodes: Oversquashing and Node Heterogeneity

要約 メッセージパッシングニューラルネットワーク(MPNN)は、さまざまなアプリ … 続きを読む

カテゴリー: cs.LG | Understanding Virtual Nodes: Oversquashing and Node Heterogeneity はコメントを受け付けていません

Learning Coarse-Grained Dynamics on Graph

要約 グラフニューラルネットワーク(GNN)非マルコビアンモデリングフレームワー … 続きを読む

カテゴリー: cond-mat.dis-nn, cs.LG, cs.NA, math.NA | Learning Coarse-Grained Dynamics on Graph はコメントを受け付けていません

Dimension-Free Convergence of Diffusion Models for Approximate Gaussian Mixtures

要約 拡散モデルは、特に反復除去を通じて高品質のサンプルを生成する際に、並外れた … 続きを読む

カテゴリー: cs.LG, cs.NA, math.NA, math.ST, stat.ML, stat.TH | Dimension-Free Convergence of Diffusion Models for Approximate Gaussian Mixtures はコメントを受け付けていません

A Llama walks into the ‘Bar’: Efficient Supervised Fine-Tuning for Legal Reasoning in the Multi-state Bar Exam

要約 法的推論タスクは、ドメイン固有の知識と推論プロセスの複雑さのために、大規模 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, I.2.1 | A Llama walks into the ‘Bar’: Efficient Supervised Fine-Tuning for Legal Reasoning in the Multi-state Bar Exam はコメントを受け付けていません

Towards Visual Text Grounding of Multimodal Large Language Model

要約 マルチモーダル大手言語モデル(MLLMS)の既存の進化にもかかわらず、特に … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Towards Visual Text Grounding of Multimodal Large Language Model はコメントを受け付けていません

Differential Transformer

要約 トランスは、無関係なコンテキストに全体的に注意を向ける傾向があります。 こ … 続きを読む

カテゴリー: cs.CL, cs.LG | Differential Transformer はコメントを受け付けていません

Mixture-of-Personas Language Models for Population Simulation

要約 大規模な言語モデル(LLMS)の進歩は、LLMが社会科学研究や機械学習モデ … 続きを読む

カテゴリー: cs.CL, cs.LG | Mixture-of-Personas Language Models for Population Simulation はコメントを受け付けていません

DeltaProduct: Improving State-Tracking in Linear RNNs via Householder Products

要約 線形再発性ニューラルネットワーク(線形RNN)は、シーケンスモデリングのた … 続きを読む

カテゴリー: cs.CL, cs.FL, cs.LG | DeltaProduct: Improving State-Tracking in Linear RNNs via Householder Products はコメントを受け付けていません

State Tuning: State-based Test-Time Scaling on RWKV-7

要約 テスト時間スケーリングは、機械学習における顕著な研究方向として浮上しており … 続きを読む

カテゴリー: cs.CL, cs.LG | State Tuning: State-based Test-Time Scaling on RWKV-7 はコメントを受け付けていません