cs.LG」カテゴリーアーカイブ

Disentangling Length from Quality in Direct Preference Optimization

要約 ヒューマン フィードバックからの強化学習 (RLHF) は、大規模言語モデ … 続きを読む

カテゴリー: cs.CL, cs.LG | Disentangling Length from Quality in Direct Preference Optimization はコメントを受け付けていません

ChatQA 2: Bridging the Gap to Proprietary LLMs in Long Context and RAG Capabilities

要約 この研究では、128K コンテキスト ウィンドウを備えた Llama 3. … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | ChatQA 2: Bridging the Gap to Proprietary LLMs in Long Context and RAG Capabilities はコメントを受け付けていません

IndicVoices-R: Unlocking a Massive Multilingual Multi-speaker Speech Corpus for Scaling Indian TTS

要約 Text-to-Speech (TTS) 合成の最近の進歩により、広範な … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.SP | IndicVoices-R: Unlocking a Massive Multilingual Multi-speaker Speech Corpus for Scaling Indian TTS はコメントを受け付けていません

CL4KGE: A Curriculum Learning Method for Knowledge Graph Embedding

要約 ナレッジ グラフ エンベディング (KGE) は、エンティティ間の論理的お … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | CL4KGE: A Curriculum Learning Method for Knowledge Graph Embedding はコメントを受け付けていません

WildVis: Open Source Visualizer for Million-Scale Chat Logs in the Wild

要約 現実世界の会話データの利用可能性が高まっているため、研究者はユーザーとチャ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC, cs.IR, cs.LG | WildVis: Open Source Visualizer for Million-Scale Chat Logs in the Wild はコメントを受け付けていません

LoQT: Low-Rank Adapters for Quantized Pre-Training

要約 大規模なニューラル ネットワークのトレーニングには、大量の計算リソースが必 … 続きを読む

カテゴリー: cs.CL, cs.LG | LoQT: Low-Rank Adapters for Quantized Pre-Training はコメントを受け付けていません

Instruct-SkillMix: A Powerful Pipeline for LLM Instruction Tuning

要約 多様で高品質の SFT データを作成するための自動化アプローチである In … 続きを読む

カテゴリー: cs.CL, cs.LG | Instruct-SkillMix: A Powerful Pipeline for LLM Instruction Tuning はコメントを受け付けていません

Improving Pretraining Data Using Perplexity Correlations

要約 多くの場合、高品質の事前トレーニング データが高パフォーマンスの言語モデル … 続きを読む

カテゴリー: cs.CL, cs.LG, stat.ML | Improving Pretraining Data Using Perplexity Correlations はコメントを受け付けていません

Bi-Directional Transformers vs. word2vec: Discovering Vulnerabilities in Lifted Compiled Code

要約 コンパイルされたバイナリ内の脆弱性を検出することは、高レベルのコード構造が … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG, cs.SE, I.2.6 | Bi-Directional Transformers vs. word2vec: Discovering Vulnerabilities in Lifted Compiled Code はコメントを受け付けていません

SciAgents: Automating scientific discovery through multi-agent intelligent graph reasoning

要約 人工知能における重要な課題は、新しい領域を探索し、複雑なパターンを特定し、 … 続きを読む

カテゴリー: cond-mat.dis-nn, cond-mat.mtrl-sci, cs.AI, cs.CL, cs.LG | SciAgents: Automating scientific discovery through multi-agent intelligent graph reasoning はコメントを受け付けていません