月別アーカイブ: 2024年5月

DiG: Scalable and Efficient Diffusion Models with Gated Linear Attention

要約 大規模な事前トレーニングを備えた拡散モデルは、特に拡散トランスフォーマー … 続きを読む

カテゴリー: cs.AI, cs.CV | DiG: Scalable and Efficient Diffusion Models with Gated Linear Attention はコメントを受け付けていません

DoRA: Enhancing Parameter-Efficient Fine-Tuning with Dynamic Rank Distribution

要約 大規模な事前トレーニング済みモデルの微調整は、本質的にリソースを大量に消費 … 続きを読む

カテゴリー: cs.CL | DoRA: Enhancing Parameter-Efficient Fine-Tuning with Dynamic Rank Distribution はコメントを受け付けていません

Selecting Large Language Model to Fine-tune via Rectified Scaling Law

要約 成長を続ける LLM のエコシステムにより、膨大なオプションの中で微調整す … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Selecting Large Language Model to Fine-tune via Rectified Scaling Law はコメントを受け付けていません

Recurrent Complex-Weighted Autoencoders for Unsupervised Object Discovery

要約 現在の最先端の同期ベースのモデルは、複素数値のアクティベーションを使用して … 続きを読む

カテゴリー: cs.LG, cs.NE | Recurrent Complex-Weighted Autoencoders for Unsupervised Object Discovery はコメントを受け付けていません

LoRA Training in the NTK Regime has No Spurious Local Minima

要約 低ランク適応 (LoRA) は、大規模言語モデル (LLM) のパラメータ … 続きを読む

カテゴリー: cs.LG, math.OC | LoRA Training in the NTK Regime has No Spurious Local Minima はコメントを受け付けていません

LOVECon: Text-driven Training-Free Long Video Editing with ControlNet

要約 事前にトレーニングされた条件付き拡散モデルを、さらなる調整を行わずにビデオ … 続きを読む

カテゴリー: cs.CV | LOVECon: Text-driven Training-Free Long Video Editing with ControlNet はコメントを受け付けていません

Structured Graph Network for Constrained Robot Crowd Navigation with Low Fidelity Simulation

要約 低忠実度シミュレータを使用して、制約付き群衆ナビゲーションのための強化学習 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Structured Graph Network for Constrained Robot Crowd Navigation with Low Fidelity Simulation はコメントを受け付けていません

Navigating the Safety Landscape: Measuring Risks in Finetuning Large Language Models

要約 安全性の調整は、人間の好みに沿って大規模言語モデル (LLM) の動作を導 … 続きを読む

カテゴリー: cs.LG | Navigating the Safety Landscape: Measuring Risks in Finetuning Large Language Models はコメントを受け付けていません

LLM-Optic: Unveiling the Capabilities of Large Language Models for Universal Visual Grounding

要約 視覚的なグラウンディングは、ユーザーが指定したテキスト クエリを画像内のク … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | LLM-Optic: Unveiling the Capabilities of Large Language Models for Universal Visual Grounding はコメントを受け付けていません

Double Correction Framework for Denoising Recommendation

要約 オンライン サービスでの可用性と汎用性により、暗黙的なフィードバックはレコ … 続きを読む

カテゴリー: cs.AI, cs.IR | Double Correction Framework for Denoising Recommendation はコメントを受け付けていません