-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年6月
ReFiNe: Recursive Field Networks for Cross-modal Multi-scene Representation
要約 マルチシェイプ表現(複数のオブジェクトを「パッキング」する単一モデル)のた … 続きを読む
ReNO: Enhancing One-step Text-to-Image Models through Reward-based Noise Optimization
要約 Text-to-Image (T2I) モデルは近年大幅に進歩しましたが、 … 続きを読む
カテゴリー: cs.CV
ReNO: Enhancing One-step Text-to-Image Models through Reward-based Noise Optimization はコメントを受け付けていません
Improving Alignment and Robustness with Short Circuiting
要約 AI システムは有害な動作を行う可能性があり、敵対的な攻撃に対して非常に脆 … 続きを読む
Step-aware Preference Optimization: Aligning Preference with Denoising Performance at Each Step
要約 最近、Direct Preference Optimization (DP … 続きを読む
カテゴリー: cs.CV
Step-aware Preference Optimization: Aligning Preference with Denoising Performance at Each Step はコメントを受け付けていません
Omni6DPose: A Benchmark and Model for Universal 6D Object Pose Estimation and Tracking
要約 6D オブジェクトの姿勢推定は、大規模なデータセットが大幅に不足しているた … 続きを読む
カテゴリー: cs.CV
Omni6DPose: A Benchmark and Model for Universal 6D Object Pose Estimation and Tracking はコメントを受け付けていません
Adaptive Sampling of k-Space in Magnetic Resonance for Rapid Pathology Prediction
要約 磁気共鳴(MR)イメージングは、その診断上の有用性が証明されているにも … 続きを読む
VidMuse: A Simple Video-to-Music Generation Framework with Long-Short-Term Modeling
要約 この研究では、ビデオのみを条件とした音楽生成を体系的に研究します。 まず、 … 続きを読む
ATraDiff: Accelerating Online Reinforcement Learning with Imaginary Trajectories
要約 まばらな報酬で自律エージェントをトレーニングすることは、データ効率が低いた … 続きを読む
DIRECT-3D: Learning Direct Text-to-3D Generation on Massive Noisy 3D Data
要約 テキスト プロンプトから高品質の 3D アセット (Neural Radi … 続きを読む
カテゴリー: cs.CV
DIRECT-3D: Learning Direct Text-to-3D Generation on Massive Noisy 3D Data はコメントを受け付けていません
SF-V: Single Forward Video Generation Model
要約 拡散ベースのビデオ生成モデルは、反復的なノイズ除去プロセスを通じて忠実度の … 続きを読む