-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年10月
PromptExp: Multi-granularity Prompt Explanation of Large Language Models
要約 大規模言語モデルは、自然言語理解やテキスト生成などのタスクに優れています。 … 続きを読む
カテゴリー: cs.CL
PromptExp: Multi-granularity Prompt Explanation of Large Language Models はコメントを受け付けていません
Controlling Language and Diffusion Models by Transporting Activations
要約 大規模な生成モデルの機能が向上し、その導入がますます広範囲に行われるように … 続きを読む
Measuring Progress in Dictionary Learning for Language Model Interpretability with Board Game Models
要約 言語モデル (LM) 表現にはどのような潜在的な機能がエンコードされていま … 続きを読む
Don’t Just Pay Attention, PLANT It: Transfer L2R Models to Fine-tune Attention in Extreme Multi-Label Text Classification
要約 最先端のエクストリーム マルチラベル テキスト分類 (XMTC) モデルは … 続きを読む
MiniPLM: Knowledge Distillation for Pre-Training Language Models
要約 知識蒸留 (KD) は、大規模な教師 LM を使用して、小規模でパフォーマ … 続きを読む
カテゴリー: cs.CL
MiniPLM: Knowledge Distillation for Pre-Training Language Models はコメントを受け付けていません
Multi-Programming Language Sandbox for LLMs
要約 MPLSandbox は、大規模言語モデル (LLM) のコンパイラおよび … 続きを読む
Benchmarking Agentic Workflow Generation
要約 大規模言語モデル (LLM) は、幅広いタスクを処理する優れた能力を備えて … 続きを読む
MInference 1.0: Accelerating Pre-filling for Long-Context LLMs via Dynamic Sparse Attention
要約 大規模言語モデル (LLM) 推論の計算上の課題は、特にプロンプトの長 … 続きを読む
BUZZ: Beehive-structured Sparse KV Cache with Segmented Heavy Hitters for Efficient LLM Inference
要約 大規模言語モデル (LLM) は自然言語処理に不可欠ですが、多くの場合、推 … 続きを読む
CORAL: Benchmarking Multi-turn Conversational Retrieval-Augmentation Generation
要約 検索拡張生成 (RAG) は、外部知識の検索を通じて大規模言語モデル (L … 続きを読む