cs.AI」カテゴリーアーカイブ

IFCap: Image-like Retrieval and Frequency-based Entity Filtering for Zero-shot Captioning

要約 画像キャプションの最近の進歩により、画像とテキストのペアのデータの制限を克 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントする

Revisit Anything: Visual Place Recognition via Image Segment Retrieval

要約 再訪問した場所を正確に認識することは、実体化したエージェントが位置を特定し … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, cs.LG, cs.RO | コメントする

Visual Data Diagnosis and Debiasing with Concept Graphs

要約 今日の深層学習モデルの広範な成功は、サイズと複雑さが大幅に異なる広範なデー … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

FreeEdit: Mask-free Reference-based Image Editing with Multi-modal Instruction

要約 画像編集にユーザー指定の視覚的概念を導入することは、これらの概念がテキスト … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

SKT: Integrating State-Aware Keypoint Trajectories with Vision-Language Models for Robotic Garment Manipulation

要約 衣服は多様で変形しやすい性質があるため、衣服操作の自動化は支援ロボットにと … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | コメントする

DiffSSC: Semantic LiDAR Scan Completion using Denoising Diffusion Probabilistic Models

要約 知覚システムは自動運転において重要な役割を果たし、複数のセンサーと対応する … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | コメントする

EfficientCrackNet: A Lightweight Model for Crack Segmentation

要約 特に舗装画像からのひび割れ検出は、強度の不均一性、複雑なトポロジー、低コン … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

AI-Powered Augmented Reality for Satellite Assembly, Integration and Test

要約 人工知能 (AI) と拡張現実 (AR) の統合により、精度が向上し、人的 … 続きを読む

カテゴリー: 68T05, 68U20, cs.AI, cs.CV, H.5.2 | コメントする

Find Rhinos without Finding Rhinos: Active Learning with Multimodal Imagery of South African Rhino Habitats

要約 地球上のカリスマ的な巨大動物の多くは人間の活動によって絶滅の危機に瀕してお … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | コメントする

Multi-View and Multi-Scale Alignment for Contrastive Language-Image Pre-training in Mammography

要約 Contrastive Language-Image Pre-traini … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | コメントする