cs.CL」カテゴリーアーカイブ

Pre-DPO: Improving Data Utilization in Direct Preference Optimization Using a Guiding Reference Model

要約 直接選好最適化(DPO)は、明示的な報酬モデルなしで人間の好みを最適化する … 続きを読む

カテゴリー: cs.CL | Pre-DPO: Improving Data Utilization in Direct Preference Optimization Using a Guiding Reference Model はコメントを受け付けていません

Exploring Cognitive and Aesthetic Causality for Multimodal Aspect-Based Sentiment Analysis

要約 マルチモーダルアスペクトベースのセンチメント分類(MASC)は、特定のアス … 続きを読む

カテゴリー: cs.CL | Exploring Cognitive and Aesthetic Causality for Multimodal Aspect-Based Sentiment Analysis はコメントを受け付けていません

Aggregating Soft Labels from Crowd Annotations Improves Uncertainty Estimation Under Distribution Shift

要約 機械学習タスクの効果的なトレーニング信号を選択することは困難です。専門家の … 続きを読む

カテゴリー: cs.CL | Aggregating Soft Labels from Crowd Annotations Improves Uncertainty Estimation Under Distribution Shift はコメントを受け付けていません

SARI: Structured Audio Reasoning via Curriculum-Guided Reinforcement Learning

要約 最近の研究は、Rehnecortion Learning(RL)が、「答え … 続きを読む

カテゴリー: cs.CL | SARI: Structured Audio Reasoning via Curriculum-Guided Reinforcement Learning はコメントを受け付けていません

On the Low-Rank Parametrization of Reward Models for Controlled Language Generation

要約 大量のデータで訓練された言語モデルは、場合によっては不適切なコンテンツを生 … 続きを読む

カテゴリー: cs.CL | On the Low-Rank Parametrization of Reward Models for Controlled Language Generation はコメントを受け付けていません

Open-World Evaluation for Retrieving Diverse Perspectives

要約 複雑で論争の多い質問に関するさまざまな視点をカバーする一連のドキュメントの … 続きを読む

カテゴリー: cs.CL, cs.IR | Open-World Evaluation for Retrieving Diverse Perspectives はコメントを受け付けていません

Optimizing RLHF Training for Large Language Models with Stage Fusion

要約 人間のフィードバック(RLHF)からの補強学習のための段階的融合を備えた効 … 続きを読む

カテゴリー: cs.CL, cs.DC, cs.LG | Optimizing RLHF Training for Large Language Models with Stage Fusion はコメントを受け付けていません

SWITCH: Studying with Teacher for Knowledge Distillation of Large Language Models

要約 大規模な言語モデル(LLMS)の成功にもかかわらず、彼らは依然として高い推 … 続きを読む

カテゴリー: cs.CL | SWITCH: Studying with Teacher for Knowledge Distillation of Large Language Models はコメントを受け付けていません

Few-shot Hate Speech Detection Based on the MindSpore Framework

要約 ソーシャルメディアでのヘイトスピーチの急増は、オンラインコミュニティに大き … 続きを読む

カテゴリー: cs.CL, cs.CY | Few-shot Hate Speech Detection Based on the MindSpore Framework はコメントを受け付けていません

Methods for Recognizing Nested Terms

要約 この論文では、ネストされた用語を抽出することに専念するRutermeval … 続きを読む

カテゴリー: cs.CL | Methods for Recognizing Nested Terms はコメントを受け付けていません