月別アーカイブ: 2025年2月

What is the Relationship between Tensor Factorizations and Circuits (and How Can We Exploit it)?

要約 本稿では、回路表現とテンソル分解という、一見異なるが基本的に関連する2つの … 続きを読む

カテゴリー: cs.LG | What is the Relationship between Tensor Factorizations and Circuits (and How Can We Exploit it)? はコメントを受け付けていません

How Do the Architecture and Optimizer Affect Representation Learning? On the Training Dynamics of Representations in Deep Neural Networks

要約 本稿では、ディープニューラルネットワーク(DNN)の表現が学習中にどのよう … 続きを読む

カテゴリー: cs.LG | How Do the Architecture and Optimizer Affect Representation Learning? On the Training Dynamics of Representations in Deep Neural Networks はコメントを受け付けていません

Mind the Gap: a Spectral Analysis of Rank Collapse and Signal Propagation in Attention Layers

要約 アテンション層は、現在の最先端のニューラルネットワークアーキテクチャである … 続きを読む

カテゴリー: cs.LG, stat.ML | Mind the Gap: a Spectral Analysis of Rank Collapse and Signal Propagation in Attention Layers はコメントを受け付けていません

Can sparse autoencoders make sense of latent representations?

要約 スパースオートエンコーダ(SAE)は最近、大規模な言語モデルにおいて解釈可 … 続きを読む

カテゴリー: cs.LG | Can sparse autoencoders make sense of latent representations? はコメントを受け付けていません

E2Former: A Linear-time Efficient and Equivariant Transformer for Scalable Molecular Modeling

要約 等変量グラフニューラルネットワーク(EGNN)は、化学、生物学、材料科学な … 続きを読む

カテゴリー: cs.LG | E2Former: A Linear-time Efficient and Equivariant Transformer for Scalable Molecular Modeling はコメントを受け付けていません

CodeMonkeys: Scaling Test-Time Compute for Software Engineering

要約 テスト時間計算のスケーリングは、LLMの能力を向上させる有望な軸である。し … 続きを読む

カテゴリー: cs.LG | CodeMonkeys: Scaling Test-Time Compute for Software Engineering はコメントを受け付けていません

Unmasking Conversational Bias in AI Multiagent Systems

要約 生成モデルによって生成された出力におけるバイアスを検出することは、重要な設 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.MA | Unmasking Conversational Bias in AI Multiagent Systems はコメントを受け付けていません

Large Language Models as Markov Chains

要約 大規模言語モデル(LLM)は、自然言語処理タスクの広い範囲において、またそ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | Large Language Models as Markov Chains はコメントを受け付けていません

WikiHint: A Human-Annotated Dataset for Hint Ranking and Generation

要約 ユーザーがチャットボットに頻繁に質問するようになり、大規模言語モデル(LL … 続きを読む

カテゴリー: cs.CL, cs.IR | WikiHint: A Human-Annotated Dataset for Hint Ranking and Generation はコメントを受け付けていません

IncogniText: Privacy-enhancing Conditional Text Anonymization via LLM-based Private Attribute Randomization

要約 本研究では、テキストの匿名化の問題を扱う。その目的は、テキストの有用性、す … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | IncogniText: Privacy-enhancing Conditional Text Anonymization via LLM-based Private Attribute Randomization はコメントを受け付けていません