cs.LG」カテゴリーアーカイブ

Preble: Efficient Distributed Prompt Scheduling for LLM Serving

要約 大規模言語モデル(LLM)へのプロンプトは、単純なユーザへの質問を超えて進 … 続きを読む

カテゴリー: cs.DC, cs.LG | Preble: Efficient Distributed Prompt Scheduling for LLM Serving はコメントを受け付けていません

Data Similarity-Based One-Shot Clustering for Multi-Task Hierarchical Federated Learning

要約 我々は、ユーザが異なるタスクの学習に取り組む階層的連合学習環境におけるクラ … 続きを読む

カテゴリー: cs.IT, cs.LG, cs.NI, eess.SP, math.IT | Data Similarity-Based One-Shot Clustering for Multi-Task Hierarchical Federated Learning はコメントを受け付けていません

OOD-Chameleon: Is Algorithm Selection for OOD Generalization Learnable?

要約 分布シフトは様々な形で現れるため、分布外(OOD)汎化は困難である。多数の … 続きを読む

カテゴリー: cs.LG | OOD-Chameleon: Is Algorithm Selection for OOD Generalization Learnable? はコメントを受け付けていません

An Online Automatic Modulation Classification Scheme Based on Isolation Distributional Kernel

要約 自動変調分類(AMC)は、現代の非協力的な通信ネットワークにおける重要な技 … 続きを読む

カテゴリー: cs.LG | An Online Automatic Modulation Classification Scheme Based on Isolation Distributional Kernel はコメントを受け付けていません

ReLIC: A Recipe for 64k Steps of In-Context Reinforcement Learning for Embodied AI

要約 知的な具現化エージェントは、長い経験の履歴を意思決定に統合することで、新し … 続きを読む

カテゴリー: cs.LG | ReLIC: A Recipe for 64k Steps of In-Context Reinforcement Learning for Embodied AI はコメントを受け付けていません

Forecasting Smog Clouds With Deep Learning

要約 この概念実証研究では、2地点間の二酸化窒素(NO2)、オゾン(O3)、(微 … 続きを読む

カテゴリー: cs.LG | Forecasting Smog Clouds With Deep Learning はコメントを受け付けていません

How to Train Long-Context Language Models (Effectively)

要約 我々は、ロングコンテクスト情報を効果的に利用するための言語モデル(LM)の … 続きを読む

カテゴリー: cs.CL, cs.LG | How to Train Long-Context Language Models (Effectively) はコメントを受け付けていません

Jailbreaking LLMs with Arabic Transliteration and Arabizi

要約 本研究では、「脱獄」攻撃に対する大規模言語モデル(LLM)の潜在的な脆弱性 … 続きを読む

カテゴリー: cs.CL, cs.LG | Jailbreaking LLMs with Arabic Transliteration and Arabizi はコメントを受け付けていません

On the Limited Generalization Capability of the Implicit Reward Model Induced by Direct Preference Optimization

要約 人間のフィードバックからの強化学習(RLHF)は、言語モデルを人間の嗜好に … 続きを読む

カテゴリー: cs.CL, cs.LG | On the Limited Generalization Capability of the Implicit Reward Model Induced by Direct Preference Optimization はコメントを受け付けていません

Grounding Large Language Models In Embodied Environment With Imperfect World Models

要約 様々なアプリケーションで広く成功を収めているにもかかわらず、大規模言語モデ … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.RO | Grounding Large Language Models In Embodied Environment With Imperfect World Models はコメントを受け付けていません