月別アーカイブ: 2024年9月

Revisit Anything: Visual Place Recognition via Image Segment Retrieval

投稿日: 2024年9月27日作成者: jarxiv

要約再訪問した場所を正確に認識することは、実体化したエージェントが位置を特定し … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.IR, cs.LG, cs.RO | コメントを受け付けていません

Chat-Scene: Bridging 3D Scene and Large Language Models with Object Identifiers

投稿日: 2024年9月27日作成者: jarxiv

要約 3D Large Language Model (LLM) の最近の進歩に … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Visual Data Diagnosis and Debiasing with Concept Graphs

投稿日: 2024年9月27日作成者: jarxiv

要約今日の深層学習モデルの広範な成功は、サイズと複雑さが大幅に異なる広範なデー … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

LightAvatar: Efficient Head Avatar as Dynamic Neural Light Field

投稿日: 2024年9月27日作成者: jarxiv

要約最近の研究では、パラメトリックモデル上の神経放射フィールド (NeRF) … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

FreeEdit: Mask-free Reference-based Image Editing with Multi-modal Instruction

投稿日: 2024年9月27日作成者: jarxiv

要約画像編集にユーザー指定の視覚的概念を導入することは、これらの概念がテキスト … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

SKT: Integrating State-Aware Keypoint Trajectories with Vision-Language Models for Robotic Garment Manipulation

投稿日: 2024年9月27日作成者: jarxiv

要約衣服は多様で変形しやすい性質があるため、衣服操作の自動化は支援ロボットにと … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Stable Video Portraits

投稿日: 2024年9月27日作成者: jarxiv

要約生成 AI および特にテキストから画像への手法の分野における急速な進歩によ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Gaussian Deja-vu: Creating Controllable 3D Gaussian Head-Avatars with Enhanced Generalization and Personalization Abilities

投稿日: 2024年9月27日作成者: jarxiv

要約 3D ガウススプラッティング (3DGS) の最近の進歩により、3D 頭 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DiffSSC: Semantic LiDAR Scan Completion using Denoising Diffusion Probabilistic Models

投稿日: 2024年9月27日作成者: jarxiv

要約知覚システムは自動運転において重要な役割を果たし、複数のセンサーと対応する … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

EfficientCrackNet: A Lightweight Model for Crack Segmentation

投稿日: 2024年9月27日作成者: jarxiv

要約特に舗装画像からのひび割れ検出は、強度の不均一性、複雑なトポロジー、低コン … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年9月

Revisit Anything: Visual Place Recognition via Image Segment Retrieval

Chat-Scene: Bridging 3D Scene and Large Language Models with Object Identifiers

Visual Data Diagnosis and Debiasing with Concept Graphs

LightAvatar: Efficient Head Avatar as Dynamic Neural Light Field

FreeEdit: Mask-free Reference-based Image Editing with Multi-modal Instruction

SKT: Integrating State-Aware Keypoint Trajectories with Vision-Language Models for Robotic Garment Manipulation

Stable Video Portraits

Gaussian Deja-vu: Creating Controllable 3D Gaussian Head-Avatars with Enhanced Generalization and Personalization Abilities

DiffSSC: Semantic LiDAR Scan Completion using Denoising Diffusion Probabilistic Models

EfficientCrackNet: A Lightweight Model for Crack Segmentation

最近の投稿

最近のコメント

アーカイブ

カテゴリー