「cs.CV」カテゴリーアーカイブ

FreeEdit: Mask-free Reference-based Image Editing with Multi-modal Instruction

投稿日: 2024年9月27日作成者: jarxiv

要約画像編集にユーザー指定の視覚的概念を導入することは、これらの概念がテキスト … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

SKT: Integrating State-Aware Keypoint Trajectories with Vision-Language Models for Robotic Garment Manipulation

投稿日: 2024年9月27日作成者: jarxiv

要約衣服は多様で変形しやすい性質があるため、衣服操作の自動化は支援ロボットにと … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Stable Video Portraits

投稿日: 2024年9月27日作成者: jarxiv

要約生成 AI および特にテキストから画像への手法の分野における急速な進歩によ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Gaussian Deja-vu: Creating Controllable 3D Gaussian Head-Avatars with Enhanced Generalization and Personalization Abilities

投稿日: 2024年9月27日作成者: jarxiv

要約 3D ガウススプラッティング (3DGS) の最近の進歩により、3D 頭 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DiffSSC: Semantic LiDAR Scan Completion using Denoising Diffusion Probabilistic Models

投稿日: 2024年9月27日作成者: jarxiv

要約知覚システムは自動運転において重要な役割を果たし、複数のセンサーと対応する … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

EfficientCrackNet: A Lightweight Model for Crack Segmentation

投稿日: 2024年9月27日作成者: jarxiv

要約特に舗装画像からのひび割れ検出は、強度の不均一性、複雑なトポロジー、低コン … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Self-supervised Pretraining for Cardiovascular Magnetic Resonance Cine Segmentation

投稿日: 2024年9月27日作成者: jarxiv

要約自己教師あり事前トレーニング (SSP) は、大規模なラベルなしデータセッ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

AI-Powered Augmented Reality for Satellite Assembly, Integration and Test

投稿日: 2024年9月27日作成者: jarxiv

要約人工知能 (AI) と拡張現実 (AR) の統合により、精度が向上し、人的 … 続きを読む →

カテゴリー: 68T05, 68U20, cs.AI, cs.CV, H.5.2 | コメントを受け付けていません

MALPOLON: A Framework for Deep Species Distribution Modeling

投稿日: 2024年9月27日作成者: jarxiv

要約このペーパーでは、ディープ SDM フレームワークである MALPOLON … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Find Rhinos without Finding Rhinos: Active Learning with Multimodal Imagery of South African Rhino Habitats

投稿日: 2024年9月27日作成者: jarxiv

要約地球上のカリスマ的な巨大動物の多くは人間の活動によって絶滅の危機に瀕してお … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

FreeEdit: Mask-free Reference-based Image Editing with Multi-modal Instruction

SKT: Integrating State-Aware Keypoint Trajectories with Vision-Language Models for Robotic Garment Manipulation

Stable Video Portraits

Gaussian Deja-vu: Creating Controllable 3D Gaussian Head-Avatars with Enhanced Generalization and Personalization Abilities

DiffSSC: Semantic LiDAR Scan Completion using Denoising Diffusion Probabilistic Models

EfficientCrackNet: A Lightweight Model for Crack Segmentation

Self-supervised Pretraining for Cardiovascular Magnetic Resonance Cine Segmentation

AI-Powered Augmented Reality for Satellite Assembly, Integration and Test

MALPOLON: A Framework for Deep Species Distribution Modeling

Find Rhinos without Finding Rhinos: Active Learning with Multimodal Imagery of South African Rhino Habitats

最近の投稿

最近のコメント

アーカイブ

カテゴリー