月別アーカイブ: 2023年8月

Dense Text-to-Image Generation with Attention Modulation

要約 既存のテキストから画像への拡散モデルは、各テキスト プロンプトが特定の画像 … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | Dense Text-to-Image Generation with Attention Modulation はコメントを受け付けていません

POCO: 3D Pose and Shape Estimation with Confidence

要約 画像からの 3D 人間の姿勢と形状 (HPS) の回帰精度はますます高まっ … 続きを読む

カテゴリー: cs.CV | POCO: 3D Pose and Shape Estimation with Confidence はコメントを受け付けていません

Qwen-VL: A Frontier Large Vision-Language Model with Versatile Abilities

要約 テキストと画像の両方を認識して理解するように設計された大規模な視覚言語モデ … 続きを読む

カテゴリー: cs.CL, cs.CV | Qwen-VL: A Frontier Large Vision-Language Model with Versatile Abilities はコメントを受け付けていません

Scenimefy: Learning to Craft Anime Scene via Semi-Supervised Image-to-Image Translation

要約 複雑な現実世界の画像からアニメ シーンを自動的に高品質にレンダリングするこ … 続きを読む

カテゴリー: cs.CV, cs.LG | Scenimefy: Learning to Craft Anime Scene via Semi-Supervised Image-to-Image Translation はコメントを受け付けていません

NeO 360: Neural Fields for Sparse View Synthesis of Outdoor Scenes

要約 最近の暗黙的ニューラル表現は、新しいビュー合成において優れた結果を示してい … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | NeO 360: Neural Fields for Sparse View Synthesis of Outdoor Scenes はコメントを受け付けていません

ROAM: Robust and Object-aware Motion Generation using Neural Pose Descriptors

要約 シーン インタラクションをサポートする 3D 仮想キャラクターのモーション … 続きを読む

カテゴリー: cs.CV | ROAM: Robust and Object-aware Motion Generation using Neural Pose Descriptors はコメントを受け付けていません

Bayesian Learning for Dynamic Target Localization with Human-provided Spatial Information

要約 この論文では、ベイジアン フレームワークにおける動的ターゲット位置特定のた … 続きを読む

カテゴリー: cs.RO | Bayesian Learning for Dynamic Target Localization with Human-provided Spatial Information はコメントを受け付けていません

An Accelerated Block Proximal Framework with Adaptive Momentum for Nonconvex and Nonsmooth Optimization

要約 非凸かつ非滑らかな最適化のための適応運動量(ABPL$^+$)を備えた加速 … 続きを読む

カテゴリー: cs.LG, math.OC | An Accelerated Block Proximal Framework with Adaptive Momentum for Nonconvex and Nonsmooth Optimization はコメントを受け付けていません

A Survey on Dataset Distillation: Approaches, Applications and Future Directions

要約 トレーニング セットが増大し続け、最先端のモデルをトレーニングするコストが … 続きを読む

カテゴリー: cs.LG | A Survey on Dataset Distillation: Approaches, Applications and Future Directions はコメントを受け付けていません

Dynamic Open Vocabulary Enhanced Safe-landing with Intelligence (DOVESEI)

要約 この研究は、都市飛行ロボットの基礎となるステップである安全な着陸を目標とし … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Dynamic Open Vocabulary Enhanced Safe-landing with Intelligence (DOVESEI) はコメントを受け付けていません