cs.CV」カテゴリーアーカイブ

FreeEdit: Mask-free Reference-based Image Editing with Multi-modal Instruction

要約 画像編集にユーザー指定の視覚的概念を導入することは、これらの概念がテキスト … 続きを読む

カテゴリー: cs.AI, cs.CV | FreeEdit: Mask-free Reference-based Image Editing with Multi-modal Instruction はコメントを受け付けていません

SKT: Integrating State-Aware Keypoint Trajectories with Vision-Language Models for Robotic Garment Manipulation

要約 衣服は多様で変形しやすい性質があるため、衣服操作の自動化は支援ロボットにと … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | SKT: Integrating State-Aware Keypoint Trajectories with Vision-Language Models for Robotic Garment Manipulation はコメントを受け付けていません

Stable Video Portraits

要約 生成 AI および特にテキストから画像への手法の分野における急速な進歩によ … 続きを読む

カテゴリー: cs.CV | Stable Video Portraits はコメントを受け付けていません

Gaussian Deja-vu: Creating Controllable 3D Gaussian Head-Avatars with Enhanced Generalization and Personalization Abilities

要約 3D ガウス スプラッティング (3DGS) の最近の進歩により、3D 頭 … 続きを読む

カテゴリー: cs.CV | Gaussian Deja-vu: Creating Controllable 3D Gaussian Head-Avatars with Enhanced Generalization and Personalization Abilities はコメントを受け付けていません

DiffSSC: Semantic LiDAR Scan Completion using Denoising Diffusion Probabilistic Models

要約 知覚システムは自動運転において重要な役割を果たし、複数のセンサーと対応する … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | DiffSSC: Semantic LiDAR Scan Completion using Denoising Diffusion Probabilistic Models はコメントを受け付けていません

EfficientCrackNet: A Lightweight Model for Crack Segmentation

要約 特に舗装画像からのひび割れ検出は、強度の不均一性、複雑なトポロジー、低コン … 続きを読む

カテゴリー: cs.AI, cs.CV | EfficientCrackNet: A Lightweight Model for Crack Segmentation はコメントを受け付けていません

Self-supervised Pretraining for Cardiovascular Magnetic Resonance Cine Segmentation

要約 自己教師あり事前トレーニング (SSP) は、大規模なラベルなしデータセッ … 続きを読む

カテゴリー: cs.CV, cs.LG | Self-supervised Pretraining for Cardiovascular Magnetic Resonance Cine Segmentation はコメントを受け付けていません

AI-Powered Augmented Reality for Satellite Assembly, Integration and Test

要約 人工知能 (AI) と拡張現実 (AR) の統合により、精度が向上し、人的 … 続きを読む

カテゴリー: 68T05, 68U20, cs.AI, cs.CV, H.5.2 | AI-Powered Augmented Reality for Satellite Assembly, Integration and Test はコメントを受け付けていません

MALPOLON: A Framework for Deep Species Distribution Modeling

要約 このペーパーでは、ディープ SDM フレームワークである MALPOLON … 続きを読む

カテゴリー: cs.CV, cs.LG | MALPOLON: A Framework for Deep Species Distribution Modeling はコメントを受け付けていません

Find Rhinos without Finding Rhinos: Active Learning with Multimodal Imagery of South African Rhino Habitats

要約 地球上のカリスマ的な巨大動物の多くは人間の活動によって絶滅の危機に瀕してお … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Find Rhinos without Finding Rhinos: Active Learning with Multimodal Imagery of South African Rhino Habitats はコメントを受け付けていません