投稿者「jarxiv」のアーカイブ

Understanding Task Vectors in In-Context Learning: Emergence, Functionality, and Limitations

要約 タスクベクトルは、タスク固有の情報を単一の再利用可能な表現に蒸留することに … 続きを読む

カテゴリー: cs.LG | Understanding Task Vectors in In-Context Learning: Emergence, Functionality, and Limitations はコメントを受け付けていません

TextAtari: 100K Frames Game Playing with Language Agents

要約 TextAtariは、最大100,000のステップにまたがる非常に長期の意 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | TextAtari: 100K Frames Game Playing with Language Agents はコメントを受け付けていません

Silencing Empowerment, Allowing Bigotry: Auditing the Moderation of Hate Speech on Twitch

要約 コンテンツモデレートの需要を満たすために、オンラインプラットフォームは自動 … 続きを読む

カテゴリー: cs.CL, cs.HC, cs.LG | Silencing Empowerment, Allowing Bigotry: Auditing the Moderation of Hate Speech on Twitch はコメントを受け付けていません

Optimized Text Embedding Models and Benchmarks for Amharic Passage Retrieval

要約 変圧器ベースの事前訓練を受けた言語モデルを使用したニューラル検索方法には、 … 続きを読む

カテゴリー: (Primary), 68T05, cs.AI, cs.CL, cs.IR, cs.LG, H.3.3 | Optimized Text Embedding Models and Benchmarks for Amharic Passage Retrieval はコメントを受け付けていません

In Praise of Stubbornness: An Empirical Case for Cognitive-Dissonance Aware Continual Update of Knowledge in LLMs

要約 体系的な経験的調査を通じて、私たちは大規模な言語モデルの根本的かつ懸念され … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, q-bio.NC | In Praise of Stubbornness: An Empirical Case for Cognitive-Dissonance Aware Continual Update of Knowledge in LLMs はコメントを受け付けていません

Measuring Data Science Automation: A Survey of Evaluation Tools for AI Assistants and Agents

要約 データサイエンスは、意思決定プロセスをサポートするために、データから洞察を … 続きを読む

カテゴリー: cs.AI, cs.CL | Measuring Data Science Automation: A Survey of Evaluation Tools for AI Assistants and Agents はコメントを受け付けていません

SAFEFLOW: A Principled Protocol for Trustworthy and Transactional Autonomous Agent Systems

要約 大規模な言語モデル(LLMS)およびビジョン言語モデル(VLM)の最近の進 … 続きを読む

カテゴリー: cs.AI, cs.CL | SAFEFLOW: A Principled Protocol for Trustworthy and Transactional Autonomous Agent Systems はコメントを受け付けていません

Cross-lingual Transfer in Programming Languages: An Extensive Empirical Study

要約 大規模な言語モデル(LLMS)は、エラー検出、クローン検出、コード翻訳など … 続きを読む

カテゴリー: cs.CL, I.2.5 | Cross-lingual Transfer in Programming Languages: An Extensive Empirical Study はコメントを受け付けていません

Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models

要約 大規模な言語モデル(LLMS)は推論に優れていますが、トレーニング後の動作 … 続きを読む

カテゴリー: cs.CL, cs.LG | Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models はコメントを受け付けていません

The impact of fine tuning in LLaMA on hallucinations for named entity extraction in legal documentation

要約 法的文書からの交通事故に関する情報の抽出は、保険会社の費用を定量化するため … 続きを読む

カテゴリー: cs.AI, cs.CL | The impact of fine tuning in LLaMA on hallucinations for named entity extraction in legal documentation はコメントを受け付けていません