月別アーカイブ: 2024年8月

Bridging and Modeling Correlations in Pairwise Data for Direct Preference Optimization

要約 広く採用されているオフライン嗜好最適化アルゴリズムである直接嗜好最適化 ( … 続きを読む

カテゴリー: cs.CL | Bridging and Modeling Correlations in Pairwise Data for Direct Preference Optimization はコメントを受け付けていません

FIPO: Free-form Instruction-oriented Prompt Optimization with Preference Dataset and Modular Fine-tuning Schema

要約 単純なプロンプトの品質が人間の専門家によって慎重に最適化されると、大規模言 … 続きを読む

カテゴリー: cs.CL | FIPO: Free-form Instruction-oriented Prompt Optimization with Preference Dataset and Modular Fine-tuning Schema はコメントを受け付けていません

Large Language Models Know What Makes Exemplary Contexts

要約 インコンテキスト学習 (ICL) は、大規模言語モデル (LLM) の進歩 … 続きを読む

カテゴリー: cs.CL | Large Language Models Know What Makes Exemplary Contexts はコメントを受け付けていません

Tree Attention: Topology-aware Decoding for Long-Context Attention on GPU clusters

要約 自己注意は、現代の変換器アーキテクチャの中核となる数学的演算であり、シーケ … 続きを読む

カテゴリー: cs.CL, cs.LG | Tree Attention: Topology-aware Decoding for Long-Context Attention on GPU clusters はコメントを受け付けていません

Lost in Overlap: Exploring Watermark Collision in LLMs

要約 コンテンツ生成における大規模言語モデル (LLM) の急増により、テキスト … 続きを読む

カテゴリー: cs.CL, cs.MM | Lost in Overlap: Exploring Watermark Collision in LLMs はコメントを受け付けていません

Assessing the Role of Lexical Semantics in Cross-lingual Transfer through Controlled Manipulations

要約 言語を越えたモデルの伝達​​は多くの設定で効果的ですが、それが機能する条件 … 続きを読む

カテゴリー: cs.CL | Assessing the Role of Lexical Semantics in Cross-lingual Transfer through Controlled Manipulations はコメントを受け付けていません

WeKnow-RAG: An Adaptive Approach for Retrieval-Augmented Generation Integrating Web Search and Knowledge Graphs

要約 大規模言語モデル (LLM) は、適応型インテリジェント エージェントの開 … 続きを読む

カテゴリー: cs.CL, cs.IR | WeKnow-RAG: An Adaptive Approach for Retrieval-Augmented Generation Integrating Web Search and Knowledge Graphs はコメントを受け付けていません

Exploring LLM Multi-Agents for ICD Coding

要約 国際疾病分類 (ICD) コーディング タスクにおける大規模言語モデル ( … 続きを読む

カテゴリー: cs.CL | Exploring LLM Multi-Agents for ICD Coding はコメントを受け付けていません

An Event Structure-aware Generative Model for Biomedical Event Extraction

要約 生物医学イベント抽出 (BEE) は、生物医学テキスト内のきめの細かいエン … 続きを読む

カテゴリー: cs.CL | An Event Structure-aware Generative Model for Biomedical Event Extraction はコメントを受け付けていません

Massive Activations in Large Language Models

要約 大規模言語モデル (LLM) では経験的な現象が観察されています。ごく少数 … 続きを読む

カテゴリー: cs.CL, cs.LG | Massive Activations in Large Language Models はコメントを受け付けていません