月別アーカイブ: 2024年9月

Revisit Anything: Visual Place Recognition via Image Segment Retrieval

要約 再訪問した場所を正確に認識することは、実体化したエージェントが位置を特定し … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, cs.LG, cs.RO | Revisit Anything: Visual Place Recognition via Image Segment Retrieval はコメントを受け付けていません

Chat-Scene: Bridging 3D Scene and Large Language Models with Object Identifiers

要約 3D Large Language Model (LLM) の最近の進歩に … 続きを読む

カテゴリー: cs.CV | Chat-Scene: Bridging 3D Scene and Large Language Models with Object Identifiers はコメントを受け付けていません

Visual Data Diagnosis and Debiasing with Concept Graphs

要約 今日の深層学習モデルの広範な成功は、サイズと複雑さが大幅に異なる広範なデー … 続きを読む

カテゴリー: cs.AI, cs.CV | Visual Data Diagnosis and Debiasing with Concept Graphs はコメントを受け付けていません

LightAvatar: Efficient Head Avatar as Dynamic Neural Light Field

要約 最近の研究では、パラメトリック モデル上の神経放射フィールド (NeRF) … 続きを読む

カテゴリー: cs.CV | LightAvatar: Efficient Head Avatar as Dynamic Neural Light Field はコメントを受け付けていません

FreeEdit: Mask-free Reference-based Image Editing with Multi-modal Instruction

要約 画像編集にユーザー指定の視覚的概念を導入することは、これらの概念がテキスト … 続きを読む

カテゴリー: cs.AI, cs.CV | FreeEdit: Mask-free Reference-based Image Editing with Multi-modal Instruction はコメントを受け付けていません

SKT: Integrating State-Aware Keypoint Trajectories with Vision-Language Models for Robotic Garment Manipulation

要約 衣服は多様で変形しやすい性質があるため、衣服操作の自動化は支援ロボットにと … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | SKT: Integrating State-Aware Keypoint Trajectories with Vision-Language Models for Robotic Garment Manipulation はコメントを受け付けていません

Stable Video Portraits

要約 生成 AI および特にテキストから画像への手法の分野における急速な進歩によ … 続きを読む

カテゴリー: cs.CV | Stable Video Portraits はコメントを受け付けていません

Gaussian Deja-vu: Creating Controllable 3D Gaussian Head-Avatars with Enhanced Generalization and Personalization Abilities

要約 3D ガウス スプラッティング (3DGS) の最近の進歩により、3D 頭 … 続きを読む

カテゴリー: cs.CV | Gaussian Deja-vu: Creating Controllable 3D Gaussian Head-Avatars with Enhanced Generalization and Personalization Abilities はコメントを受け付けていません

DiffSSC: Semantic LiDAR Scan Completion using Denoising Diffusion Probabilistic Models

要約 知覚システムは自動運転において重要な役割を果たし、複数のセンサーと対応する … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | DiffSSC: Semantic LiDAR Scan Completion using Denoising Diffusion Probabilistic Models はコメントを受け付けていません

EfficientCrackNet: A Lightweight Model for Crack Segmentation

要約 特に舗装画像からのひび割れ検出は、強度の不均一性、複雑なトポロジー、低コン … 続きを読む

カテゴリー: cs.AI, cs.CV | EfficientCrackNet: A Lightweight Model for Crack Segmentation はコメントを受け付けていません