-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
Finite State Automata Inside Transformers with Chain-of-Thought: A Mechanistic Study on State Tracking
要約 チェーンオブ思考(COT)は、幅広いタスクにわたって大規模な言語モデル(L … 続きを読む
Similarity-Distance-Magnitude Universal Verification
要約 類似性(つまり、トレーニングに深さマッチを正しく予測する)を追加することに … 続きを読む
Re-evaluating Open-ended Evaluation of Large Language Models
要約 評価は、伝統的に特定のスキルの候補者のランキングに焦点を当ててきました。 … 続きを読む
The Impact of Unstated Norms in Bias Analysis of Language Models
要約 大規模な言語モデル(LLM)のバイアスには、明白な差別から暗黙のステレオタ … 続きを読む
Improving Neuron-level Interpretability with White-box Language Models
要約 GPT-2のような自動再帰言語モデルのニューロンは、その活性化パターンを分 … 続きを読む
Layer-Aware Task Arithmetic: Disentangling Task-Specific and Instruction-Following Knowledge
要約 大規模な言語モデル(LLMS)は、微調整を通じてタスク固有の強力な機能を示 … 続きを読む
Why Are Web AI Agents More Vulnerable Than Standalone LLMs? A Security Analysis
要約 Web AIエージェントの最近の進歩により、複雑なWebナビゲーションタス … 続きを読む
Remove Symmetries to Control Model Expressivity and Improve Optimization
要約 対称性が損失関数に存在する場合、モデルは「崩壊」として知られる場合がある低 … 続きを読む
Teasing Apart Architecture and Initial Weights as Sources of Inductive Bias in Neural Networks
要約 人工ニューラルネットワークは、データから人間の知識の多くの側面を獲得するこ … 続きを読む
A Polynomial-Time Approximation for Pairwise Fair $k$-Median Clustering
要約 この作業では、$ \ ell \ ge 2 $グループを使用してペアワイズ … 続きを読む