-
最近の投稿
- Contextual Backpropagation Loops: Amplifying Deep Reasoning with Iterative Top-Down Feedback
- YuLan-Mini: An Open Data-efficient Language Model
- SMAC-Hard: Enabling Mixed Opponent Strategy Script and Self-play on SMAC
- Towards An Unsupervised Learning Scheme for Efficiently Solving Parameterized Mixed-Integer Programs
- RAGONITE: Iterative Retrieval on Induced Databases and Verbalized RDF for Conversational QA over KGs with RAG
-
最近のコメント
表示できるコメントはありません。 cs.AI (31386) cs.CL (23739) cs.CR (2434) cs.CV (37743) cs.LG (36257) cs.RO (18352) cs.SY (2813) eess.IV (4535) eess.SY (2807) stat.ML (4810)
月別アーカイブ: 2024年5月
Expert Proximity as Surrogate Rewards for Single Demonstration Imitation Learning
要約 この論文では、複数の専門家のデモンストレーションを取得するのにコストがかか … 続きを読む
カテゴリー: cs.LG
Expert Proximity as Surrogate Rewards for Single Demonstration Imitation Learning はコメントを受け付けていません
Oja’s Algorithm for Sparse PCA
要約 $d$ 次元空間内の $n$ データポイントの主成分分析 (PCA) をス … 続きを読む
Reconstruction Attacks on Machine Unlearning: Simple Models are Vulnerable
要約 機械の非学習は、データの自律性への欲求によって動機付けられています。つまり … 続きを読む
カテゴリー: cs.LG
Reconstruction Attacks on Machine Unlearning: Simple Models are Vulnerable はコメントを受け付けていません
A Provably Effective Method for Pruning Experts in Fine-tuned Sparse Mixture-of-Experts
要約 疎ゲート混合エキスパート (MoE) アーキテクチャは、トレーニング可能な … 続きを読む
カテゴリー: cs.LG
A Provably Effective Method for Pruning Experts in Fine-tuned Sparse Mixture-of-Experts はコメントを受け付けていません
Nonuniqueness and Convergence to Equivalent Solutions in Observer-based Inverse Reinforcement Learning
要約 決定論的逆強化学習 (IRL) 問題をオンラインかつリアルタイムで解決する … 続きを読む
Sequence-Augmented SE(3)-Flow Matching For Conditional Protein Backbone Generation
要約 タンパク質はほぼすべての生物学的プロセスに不可欠であり、その多様な機能は複 … 続きを読む
カテゴリー: cs.LG
Sequence-Augmented SE(3)-Flow Matching For Conditional Protein Backbone Generation はコメントを受け付けていません
Sharp Rates in Dependent Learning Theory: Avoiding Sample Size Deflation for the Square Loss
要約 この研究では、$\Psi_p$ がノルムである仮説クラス $\mathsc … 続きを読む
Uncertainty of Thoughts: Uncertainty-Aware Planning Enhances Information Seeking in Large Language Models
要約 不確実性に直面した場合、*情報を探す*能力は基本的に重要です。 医療診断や … 続きを読む
Student Answer Forecasting: Transformer-Driven Answer Choice Prediction for Language Learning
要約 インテリジェント個別指導システム (ITS) は、生徒の答えを予測してカス … 続きを読む
The Fine-Tuning Paradox: Boosting Translation Quality Without Sacrificing LLM Abilities
要約 機械翻訳用の大規模言語モデル (LLM) を微調整すると、全体的な翻訳品質 … 続きを読む
カテゴリー: cs.CL
The Fine-Tuning Paradox: Boosting Translation Quality Without Sacrificing LLM Abilities はコメントを受け付けていません