月別アーカイブ: 2024年6月

ReFiNe: Recursive Field Networks for Cross-modal Multi-scene Representation

要約 マルチシェイプ表現(複数のオブジェクトを「パッキング」する単一モデル)のた … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG, cs.MM | ReFiNe: Recursive Field Networks for Cross-modal Multi-scene Representation はコメントを受け付けていません

ReNO: Enhancing One-step Text-to-Image Models through Reward-based Noise Optimization

要約 Text-to-Image (T2I) モデルは近年大幅に進歩しましたが、 … 続きを読む

カテゴリー: cs.CV | ReNO: Enhancing One-step Text-to-Image Models through Reward-based Noise Optimization はコメントを受け付けていません

Improving Alignment and Robustness with Short Circuiting

要約 AI システムは有害な動作を行う可能性があり、敵対的な攻撃に対して非常に脆 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.CY, cs.LG | Improving Alignment and Robustness with Short Circuiting はコメントを受け付けていません

Step-aware Preference Optimization: Aligning Preference with Denoising Performance at Each Step

要約 最近、Direct Preference Optimization (DP … 続きを読む

カテゴリー: cs.CV | Step-aware Preference Optimization: Aligning Preference with Denoising Performance at Each Step はコメントを受け付けていません

Omni6DPose: A Benchmark and Model for Universal 6D Object Pose Estimation and Tracking

要約 6D オブジェクトの姿勢推定は、大規模なデータセットが大幅に不足しているた … 続きを読む

カテゴリー: cs.CV | Omni6DPose: A Benchmark and Model for Universal 6D Object Pose Estimation and Tracking はコメントを受け付けていません

Adaptive Sampling of k-Space in Magnetic Resonance for Rapid Pathology Prediction

要約 磁気共鳴(MR)イメージングは​​、その診断上の有用性が証明されているにも … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Adaptive Sampling of k-Space in Magnetic Resonance for Rapid Pathology Prediction はコメントを受け付けていません

VidMuse: A Simple Video-to-Music Generation Framework with Long-Short-Term Modeling

要約 この研究では、ビデオのみを条件とした音楽生成を体系的に研究します。 まず、 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM, cs.SD | VidMuse: A Simple Video-to-Music Generation Framework with Long-Short-Term Modeling はコメントを受け付けていません

ATraDiff: Accelerating Online Reinforcement Learning with Imaginary Trajectories

要約 まばらな報酬で自律エージェントをトレーニングすることは、データ効率が低いた … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | ATraDiff: Accelerating Online Reinforcement Learning with Imaginary Trajectories はコメントを受け付けていません

DIRECT-3D: Learning Direct Text-to-3D Generation on Massive Noisy 3D Data

要約 テキスト プロンプトから高品質の 3D アセット (Neural Radi … 続きを読む

カテゴリー: cs.CV | DIRECT-3D: Learning Direct Text-to-3D Generation on Massive Noisy 3D Data はコメントを受け付けていません

SF-V: Single Forward Video Generation Model

要約 拡散ベースのビデオ生成モデルは、反復的なノイズ除去プロセスを通じて忠実度の … 続きを読む

カテゴリー: cs.CV, eess.IV | SF-V: Single Forward Video Generation Model はコメントを受け付けていません