cs.CV」カテゴリーアーカイブ

What is YOLOv6? A Deep Insight into the Object Detection Model

要約 この作業では、YOLOv6 オブジェクト検出モデルを詳しく調査し、その設計 … 続きを読む

カテゴリー: cs.CV | What is YOLOv6? A Deep Insight into the Object Detection Model はコメントを受け付けていません

Can Generative Models Improve Self-Supervised Representation Learning?

要約 自己教師あり表現学習の急速な進歩により、ラベルのないデータを活用してリッチ … 続きを読む

カテゴリー: cs.CV, cs.LG | Can Generative Models Improve Self-Supervised Representation Learning? はコメントを受け付けていません

Measurement of Medial Elbow Joint Space using Landmark Detection

要約 肘内側の超音波画像診断は、尺骨側副靱帯 (UCL) 損傷を早期に特定するた … 続きを読む

カテゴリー: cs.CV | Measurement of Medial Elbow Joint Space using Landmark Detection はコメントを受け付けていません

A New Adversarial Perspective for LiDAR-based 3D Object Detection

要約 自動運転車 (AV) は、運転シナリオにおける環境認識と意思決定のために … 続きを読む

カテゴリー: cs.CV | A New Adversarial Perspective for LiDAR-based 3D Object Detection はコメントを受け付けていません

NAVCON: A Cognitively Inspired and Linguistically Grounded Corpus for Vision and Language Navigation

要約 我々は、2 つの人気のあるデータセット (R2R と RxR) の上に構築 … 続きを読む

カテゴリー: cs.CL, cs.CV | NAVCON: A Cognitively Inspired and Linguistically Grounded Corpus for Vision and Language Navigation はコメントを受け付けていません

Benchmarking Embedding Aggregation Methods in Computational Pathology: A Clinical Data Perspective

要約 人工知能 (AI) の最近の進歩、特に基礎モデル (FM) の自己教師あり … 続きを読む

カテゴリー: cs.CV | Benchmarking Embedding Aggregation Methods in Computational Pathology: A Clinical Data Perspective はコメントを受け付けていません

EOGS: Gaussian Splatting for Earth Observation

要約 最近、ガウス スプラッティングが NeRF の強力な代替手段として登場し、 … 続きを読む

カテゴリー: cs.CV | EOGS: Gaussian Splatting for Earth Observation はコメントを受け付けていません

SVGBuilder: Component-Based Colored SVG Generation with Text-Guided Autoregressive Transformers

要約 スケーラブル ベクター グラフィックス (SVG) は、解像度の独立性とス … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | SVGBuilder: Component-Based Colored SVG Generation with Text-Guided Autoregressive Transformers はコメントを受け付けていません

Modality-Inconsistent Continual Learning of Multimodal Large Language Models

要約 このペーパーでは、一貫性のないモダリティ (画像、音声、またはビデオ) と … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.SD, eess.AS | Modality-Inconsistent Continual Learning of Multimodal Large Language Models はコメントを受け付けていません

FunEditor: Achieving Complex Image Edits via Function Aggregation with Diffusion Models

要約 拡散モデルは生成タスクにおいて優れたパフォーマンスを実証しており、画像編集 … 続きを読む

カテゴリー: cs.CV | FunEditor: Achieving Complex Image Edits via Function Aggregation with Diffusion Models はコメントを受け付けていません