-
最近の投稿
- Predicting center of mass position in non-cyclic activities: The influence of acceleration, prediction horizon, and ground reaction forces
- Are Transformers Truly Foundational for Robotics?
- Performance Evaluation of Deep Learning-Based State Estimation: A Comparative Study of KalmanNet
- Performance Assessment of Lidar Odometry Frameworks: A Case Study at the Australian Botanic Garden Mount Annan
- VLM-Social-Nav: Socially Aware Robot Navigation through Scoring using Vision-Language Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (30189) cs.CL (22805) cs.CR (2340) cs.CV (36561) cs.LG (35013) cs.RO (17553) cs.SY (2697) eess.IV (4453) eess.SY (2691) stat.ML (4664)
月別アーカイブ: 2024年10月
PromptExp: Multi-granularity Prompt Explanation of Large Language Models
要約 大規模言語モデルは、自然言語理解やテキスト生成などのタスクに優れています。 … 続きを読む
カテゴリー: cs.CL
PromptExp: Multi-granularity Prompt Explanation of Large Language Models はコメントを受け付けていません
Controlling Language and Diffusion Models by Transporting Activations
要約 大規模な生成モデルの機能が向上し、その導入がますます広範囲に行われるように … 続きを読む
Measuring Progress in Dictionary Learning for Language Model Interpretability with Board Game Models
要約 言語モデル (LM) 表現にはどのような潜在的な機能がエンコードされていま … 続きを読む
Don’t Just Pay Attention, PLANT It: Transfer L2R Models to Fine-tune Attention in Extreme Multi-Label Text Classification
要約 最先端のエクストリーム マルチラベル テキスト分類 (XMTC) モデルは … 続きを読む
MiniPLM: Knowledge Distillation for Pre-Training Language Models
要約 知識蒸留 (KD) は、大規模な教師 LM を使用して、小規模でパフォーマ … 続きを読む
カテゴリー: cs.CL
MiniPLM: Knowledge Distillation for Pre-Training Language Models はコメントを受け付けていません
Multi-Programming Language Sandbox for LLMs
要約 MPLSandbox は、大規模言語モデル (LLM) のコンパイラおよび … 続きを読む
Benchmarking Agentic Workflow Generation
要約 大規模言語モデル (LLM) は、幅広いタスクを処理する優れた能力を備えて … 続きを読む
MInference 1.0: Accelerating Pre-filling for Long-Context LLMs via Dynamic Sparse Attention
要約 大規模言語モデル (LLM) 推論の計算上の課題は、特にプロンプトの長 … 続きを読む
BUZZ: Beehive-structured Sparse KV Cache with Segmented Heavy Hitters for Efficient LLM Inference
要約 大規模言語モデル (LLM) は自然言語処理に不可欠ですが、多くの場合、推 … 続きを読む
CORAL: Benchmarking Multi-turn Conversational Retrieval-Augmentation Generation
要約 検索拡張生成 (RAG) は、外部知識の検索を通じて大規模言語モデル (L … 続きを読む