月別アーカイブ: 2024年8月

Iterative Graph Alignment

要約 多様な物語を圧縮することで、LLM は暗記を超え、一般化可能な因果関係を捉 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.MA | Iterative Graph Alignment はコメントを受け付けていません

Entropic Distribution Matching in Supervised Fine-tuning of LLMs: Less Overfitting and Better Diversity

要約 大規模な言語モデルは、下流のタスクに特化するために教師あり微調整 (SFT … 続きを読む

カテゴリー: cs.AI, cs.LG | Entropic Distribution Matching in Supervised Fine-tuning of LLMs: Less Overfitting and Better Diversity はコメントを受け付けていません

Jina-ColBERT-v2: A General-Purpose Multilingual Late Interaction Retriever

要約 ColBERT などのマルチベクトル高密度モデルは、情報検索に非常に効果的 … 続きを読む

カテゴリー: 68T50, cs.AI, cs.CL, cs.IR, I.2.7 | Jina-ColBERT-v2: A General-Purpose Multilingual Late Interaction Retriever はコメントを受け付けていません

GEAR: An Efficient KV Cache Compression Recipe for Near-Lossless Generative Inference of LLM

要約 キー値 (KV) キャッシュは、大規模言語モデル (LLM) 推論の生成速 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | GEAR: An Efficient KV Cache Compression Recipe for Near-Lossless Generative Inference of LLM はコメントを受け付けていません

Quantifying Geospatial in the Common Crawl Corpus

要約 大規模言語モデル (LLM) は、Common Crawl (CC) コー … 続きを読む

カテゴリー: cs.AI, cs.CL | Quantifying Geospatial in the Common Crawl Corpus はコメントを受け付けていません

A GREAT Architecture for Edge-Based Graph Problems Like TSP

要約 ここ数年、ルーティング問題などの組み合わせ最適化問題に取り組むために、多く … 続きを読む

カテゴリー: cs.AI, cs.LG | A GREAT Architecture for Edge-Based Graph Problems Like TSP はコメントを受け付けていません

Mini-Omni: Language Models Can Hear, Talk While Thinking in Streaming

要約 言語モデルの最近の進歩は大幅な進歩を遂げています。 GPT-4o は新たな … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC, cs.LG, cs.SD, eess.AS | Mini-Omni: Language Models Can Hear, Talk While Thinking in Streaming はコメントを受け付けていません

FilFL: Client Filtering for Optimized Client Participation in Federated Learning

要約 新しい機械学習パラダイムであるフェデレーテッド ラーニングを使用すると、ク … 続きを読む

カテゴリー: cs.AI, cs.DC, cs.LG | FilFL: Client Filtering for Optimized Client Participation in Federated Learning はコメントを受け付けていません

Smaller, Weaker, Yet Better: Training LLM Reasoners via Compute-Optimal Sampling

要約 強力な言語モデル (LM) からの高品質の合成データをトレーニングすること … 続きを読む

カテゴリー: cs.AI, cs.CL | Smaller, Weaker, Yet Better: Training LLM Reasoners via Compute-Optimal Sampling はコメントを受け付けていません

Assessing Large Language Models for Online Extremism Research: Identification, Explanation, and New Knowledge

要約 米国では暴力的過激主義が大幅に増加しており、オンラインでの過激派イデオロギ … 続きを読む

カテゴリー: cs.AI, cs.CL | Assessing Large Language Models for Online Extremism Research: Identification, Explanation, and New Knowledge はコメントを受け付けていません