月別アーカイブ: 2025年1月

A non-ergodic framework for understanding emergent capabilities in Large Language Models

要約 大規模な言語モデルには、スケールに応じて予期せぬ形で出現する能力があるが、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | A non-ergodic framework for understanding emergent capabilities in Large Language Models はコメントを受け付けていません

Unsupervised Robust Cross-Lingual Entity Alignment via Neighbor Triple Matching with Entity and Relation Texts

要約 クロスリンガルエンティティアライメント(EA)は、異なる言語間の複数の知識 … 続きを読む

カテゴリー: cs.AI, cs.CL | Unsupervised Robust Cross-Lingual Entity Alignment via Neighbor Triple Matching with Entity and Relation Texts はコメントを受け付けていません

Multimodal Contrastive Representation Learning in Augmented Biomedical Knowledge Graphs

要約 バイオメディカル知識グラフ(BKG)は、バイオメディカル分野における複雑な … 続きを読む

カテゴリー: cs.CL, cs.LG | Multimodal Contrastive Representation Learning in Augmented Biomedical Knowledge Graphs はコメントを受け付けていません

MIRAGE: Exploring How Large Language Models Perform in Complex Social Interactive Environments

要約 大規模言語モデル(LLM)は、環境認識、推論に基づく意思決定、複雑な人間行 … 続きを読む

カテゴリー: cs.CL | MIRAGE: Exploring How Large Language Models Perform in Complex Social Interactive Environments はコメントを受け付けていません

OmniFlatten: An End-to-end GPT Model for Seamless Voice Conversation

要約 全二重音声対話システムは、従来のターンベースの対話システムを大幅に凌駕して … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | OmniFlatten: An End-to-end GPT Model for Seamless Voice Conversation はコメントを受け付けていません

EPS-MoE: Expert Pipeline Scheduler for Cost-Efficient MoE Inference

要約 MoE(Mixture-of-Experts)モデルは、大規模言語モデル( … 続きを読む

カテゴリー: cs.CL, cs.DC | EPS-MoE: Expert Pipeline Scheduler for Cost-Efficient MoE Inference はコメントを受け付けていません

An Overview and Discussion on Using Large Language Models for Implementation Generation of Solutions to Open-Ended Problems

要約 ラージ・ランゲージ・モデルは、アルゴリズムの仕様を必要とし、パフォーマンス … 続きを読む

カテゴリー: cs.AI, cs.CL | An Overview and Discussion on Using Large Language Models for Implementation Generation of Solutions to Open-Ended Problems はコメントを受け付けていません

CoT-based Synthesizer: Enhancing LLM Performance through Answer Synthesis

要約 自己無撞着やBest-of-Nなどの現在の推論スケーリング手法は、複雑な推 … 続きを読む

カテゴリー: cs.CL | CoT-based Synthesizer: Enhancing LLM Performance through Answer Synthesis はコメントを受け付けていません

EventSum: A Large-Scale Event-Centric Summarization Dataset for Chinese Multi-News Documents

要約 実生活では、大災害や大規模なスポーツイベントなど、多くのダイナミックな出来 … 続きを読む

カテゴリー: cs.CL | EventSum: A Large-Scale Event-Centric Summarization Dataset for Chinese Multi-News Documents はコメントを受け付けていません

Adaptive Few-shot Prompting for Machine Translation with Pre-trained Language Models

要約 近年、文脈内学習を用いた大規模言語モデル(Large Language M … 続きを読む

カテゴリー: cs.AI, cs.CL | Adaptive Few-shot Prompting for Machine Translation with Pre-trained Language Models はコメントを受け付けていません