月別アーカイブ: 2024年6月

Separations in the Representational Capabilities of Transformers and Recurrent Architectures

要約 変圧器アーキテクチャは基礎モデルに広く採用されています。 推論コストが高い … 続きを読む

On the Expressibility of the Reconstructional Color Refinement

要約 有名なウラム再構成予想に関連する最も基本的な事実の 1 つは、グラフの接続 … 続きを読む

Advancing Graph Generation through Beta Diffusion

要約 拡散モデルは自然画像の生成に有効であることが実証されており、グラフなどのさ … 続きを読む

Understanding Hallucinations in Diffusion Models through Mode Interpolation

要約 口語的に言えば、拡散プロセスに基づく画像生成モデルは、トレーニング データ … 続きを読む

Unichain and Aperiodicity are Sufficient for Asymptotic Optimality of Average-Reward Restless Bandits

要約 無限の地平線、平均報酬の落ち着きのない盗賊問題を離散時間で考察します。 私 … 続きを読む

Data-dependent and Oracle Bounds on Forgetting in Continual Learning

要約 継続的な学習では、知識を保存してタスク間で再利用し、将来のタスクへの適切な … 続きを読む

Efficient Discrepancy Testing for Learning with Distribution Shift

要約 ドメイン適応の分野におけるトレイン分布とテスト分布の間の距離の基本的な概念 … 続きを読む

Learning conditional distributions on continuous spaces

要約 私たちは、特徴空間とターゲット空間のさまざまな次元を考慮して、多次元ユニッ … 続きを読む

Why Warmup the Learning Rate? Underlying Mechanisms and Improvements

要約 深層学習では、学習率 $\eta$ をウォームアップするのが一般的であり、 … 続きを読む

SciKnowEval: Evaluating Multi-level Scientific Knowledge of Large Language Models

要約 科学研究における大規模言語モデル (LLM) の利用が急増しているため、科 … 続きを読む

