cs.LG」カテゴリーアーカイブ

Can sparse autoencoders make sense of latent representations?

要約 スパースオートエンコーダ(SAE)は最近、大規模な言語モデルにおいて解釈可 … 続きを読む

カテゴリー: cs.LG | Can sparse autoencoders make sense of latent representations? はコメントを受け付けていません

E2Former: A Linear-time Efficient and Equivariant Transformer for Scalable Molecular Modeling

要約 等変量グラフニューラルネットワーク(EGNN)は、化学、生物学、材料科学な … 続きを読む

カテゴリー: cs.LG | E2Former: A Linear-time Efficient and Equivariant Transformer for Scalable Molecular Modeling はコメントを受け付けていません

CodeMonkeys: Scaling Test-Time Compute for Software Engineering

要約 テスト時間計算のスケーリングは、LLMの能力を向上させる有望な軸である。し … 続きを読む

カテゴリー: cs.LG | CodeMonkeys: Scaling Test-Time Compute for Software Engineering はコメントを受け付けていません

Large Language Models as Markov Chains

要約 大規模言語モデル(LLM)は、自然言語処理タスクの広い範囲において、またそ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | Large Language Models as Markov Chains はコメントを受け付けていません

IncogniText: Privacy-enhancing Conditional Text Anonymization via LLM-based Private Attribute Randomization

要約 本研究では、テキストの匿名化の問題を扱う。その目的は、テキストの有用性、す … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG | IncogniText: Privacy-enhancing Conditional Text Anonymization via LLM-based Private Attribute Randomization はコメントを受け付けていません

On the Loss of Context-awareness in General Instruction Fine-tuning

要約 事前学習された大規模言語モデル(LLM)は、命令への追従を可能にするために … 続きを読む

カテゴリー: cs.CL, cs.LG | On the Loss of Context-awareness in General Instruction Fine-tuning はコメントを受け付けていません

A Review on Knowledge Graphs for Healthcare: Resources, Applications, and Promises

要約 本総説は、ヘルスケア知識グラフ(HKG)の現状を概観し、その構築、利用モデ … 続きを読む

カテゴリー: 68T09, 68T30, 68T50, cs.AI, cs.CL, cs.LG, cs.SI, I.2.4 | A Review on Knowledge Graphs for Healthcare: Resources, Applications, and Promises はコメントを受け付けていません

The Open Source Advantage in Large Language Models (LLMs)

要約 大規模言語モデル(LLM)は自然言語処理を急速に発展させ、テキスト生成、機 … 続きを読む

カテゴリー: cs.CL, cs.LG, I.2.7 | The Open Source Advantage in Large Language Models (LLMs) はコメントを受け付けていません

Aligning Brain Activity with Advanced Transformer Models: Exploring the Role of Punctuation in Semantic Processing

要約 本研究では、テキスト理解における句読点の意味的意義を重視し、神経活動と高度 … 続きを読む

カテゴリー: cs.CL, cs.LG | Aligning Brain Activity with Advanced Transformer Models: Exploring the Role of Punctuation in Semantic Processing はコメントを受け付けていません

Neural Algorithmic Reasoning for Hypergraphs with Looped Transformers

要約 ループトランスフォーマーは、伝統的なグラフアルゴリズムをシミュレートする上 … 続きを読む

カテゴリー: cs.AI, cs.CC, cs.CL, cs.LG | Neural Algorithmic Reasoning for Hypergraphs with Looped Transformers はコメントを受け付けていません