cs.CV」カテゴリーアーカイブ

Revisit Anything: Visual Place Recognition via Image Segment Retrieval

要約 再訪問した場所を正確に認識することは、実体化したエージェントが位置を特定し … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, cs.LG, cs.RO | コメントする

Chat-Scene: Bridging 3D Scene and Large Language Models with Object Identifiers

要約 3D Large Language Model (LLM) の最近の進歩に … 続きを読む

カテゴリー: cs.CV | コメントする

Visual Data Diagnosis and Debiasing with Concept Graphs

要約 今日の深層学習モデルの広範な成功は、サイズと複雑さが大幅に異なる広範なデー … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

LightAvatar: Efficient Head Avatar as Dynamic Neural Light Field

要約 最近の研究では、パラメトリック モデル上の神経放射フィールド (NeRF) … 続きを読む

カテゴリー: cs.CV | コメントする

FreeEdit: Mask-free Reference-based Image Editing with Multi-modal Instruction

要約 画像編集にユーザー指定の視覚的概念を導入することは、これらの概念がテキスト … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

SKT: Integrating State-Aware Keypoint Trajectories with Vision-Language Models for Robotic Garment Manipulation

要約 衣服は多様で変形しやすい性質があるため、衣服操作の自動化は支援ロボットにと … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | コメントする

Stable Video Portraits

要約 生成 AI および特にテキストから画像への手法の分野における急速な進歩によ … 続きを読む

カテゴリー: cs.CV | コメントする

Gaussian Deja-vu: Creating Controllable 3D Gaussian Head-Avatars with Enhanced Generalization and Personalization Abilities

要約 3D ガウス スプラッティング (3DGS) の最近の進歩により、3D 頭 … 続きを読む

カテゴリー: cs.CV | コメントする

DiffSSC: Semantic LiDAR Scan Completion using Denoising Diffusion Probabilistic Models

要約 知覚システムは自動運転において重要な役割を果たし、複数のセンサーと対応する … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | コメントする

EfficientCrackNet: A Lightweight Model for Crack Segmentation

要約 特に舗装画像からのひび割れ検出は、強度の不均一性、複雑なトポロジー、低コン … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする