月別アーカイブ: 2024年7月

CS3: Cascade SAM for Sperm Segmentation

要約 自動化された精子形態解析は、男性の生殖能力の評価において重要な役割を果たし … 続きを読む

カテゴリー: cs.CV, eess.IV, q-bio.QM | CS3: Cascade SAM for Sperm Segmentation はコメントを受け付けていません

High-Quality Medical Image Generation from Free-hand Sketch

要約 人間が描いたフリーハンドのスケッチから医用画像を生成することは、さまざまな … 続きを読む

カテゴリー: cs.CV | High-Quality Medical Image Generation from Free-hand Sketch はコメントを受け付けていません

HumanRefiner: Benchmarking Abnormal Human Generation and Refining with Coarse-to-fine Pose-Reversible Guidance

要約 テキストから画像への拡散モデルは、条件付き画像生成において大幅に進歩しまし … 続きを読む

カテゴリー: cs.CV | HumanRefiner: Benchmarking Abnormal Human Generation and Refining with Coarse-to-fine Pose-Reversible Guidance はコメントを受け付けていません

RodinHD: High-Fidelity 3D Avatar Generation with Diffusion Models

要約 ポートレート画像から高忠実度の3Dアバターを生成できるRodinHDを紹介 … 続きを読む

カテゴリー: cs.CV | RodinHD: High-Fidelity 3D Avatar Generation with Diffusion Models はコメントを受け付けていません

Towards Open-World Mobile Manipulation in Homes: Lessons from the Neurips 2023 HomeRobot Open Vocabulary Mobile Manipulation Challenge

要約 多用途かつ有能なホームアシスタントとして効果的に機能するロボットを開発する … 続きを読む

カテゴリー: cs.CV, cs.RO | Towards Open-World Mobile Manipulation in Homes: Lessons from the Neurips 2023 HomeRobot Open Vocabulary Mobile Manipulation Challenge はコメントを受け付けていません

AUFormer: Vision Transformers are Parameter-Efficient Facial Action Unit Detectors

要約 フェイシャル アクション ユニット (AU) は、感情コンピューティングの … 続きを読む

カテゴリー: cs.AI, cs.CV | AUFormer: Vision Transformers are Parameter-Efficient Facial Action Unit Detectors はコメントを受け付けていません

Momentum Auxiliary Network for Supervised Local Learning

要約 ディープ ニューラル ネットワークは従来、トレーニング プロセスにエンドツ … 続きを読む

カテゴリー: cs.CV | Momentum Auxiliary Network for Supervised Local Learning はコメントを受け付けていません

Joint prototype and coefficient prediction for 3D instance segmentation

要約 3D インスタンスのセグメンテーションは、包括的な 3D シーンの理解を必 … 続きを読む

カテゴリー: cs.CV | Joint prototype and coefficient prediction for 3D instance segmentation はコメントを受け付けていません

Adaptive Multi-modal Fusion of Spatially Variant Kernel Refinement with Diffusion Model for Blind Image Super-Resolution

要約 画像生成に利用される事前トレーニング済みの拡散モデルには、複雑なテクスチャ … 続きを読む

カテゴリー: cs.CV, eess.IV | Adaptive Multi-modal Fusion of Spatially Variant Kernel Refinement with Diffusion Model for Blind Image Super-Resolution はコメントを受け付けていません

Parameter-Efficient and Memory-Efficient Tuning for Vision Transformer: A Disentangled Approach

要約 パラメータ効率の高い転移学習 (PETL) に関する最近の研究では、学習可 … 続きを読む

カテゴリー: cs.CV | Parameter-Efficient and Memory-Efficient Tuning for Vision Transformer: A Disentangled Approach はコメントを受け付けていません