cs.CV」カテゴリーアーカイブ

VP-MEL: Visual Prompts Guided Multimodal Entity Linking

要約 マルチモーダル エンティティ リンク (MEL) は、情報検索の分野で広く … 続きを読む

カテゴリー: cs.CL, cs.CV | VP-MEL: Visual Prompts Guided Multimodal Entity Linking はコメントを受け付けていません

Take Fake as Real: Realistic-like Robust Black-box Adversarial Attack to Evade AIGC Detection

要約 GAN と拡散モデルに基づく AI 生成コンテンツ (AIGC) 検出のセ … 続きを読む

カテゴリー: cs.CV | Take Fake as Real: Realistic-like Robust Black-box Adversarial Attack to Evade AIGC Detection はコメントを受け付けていません

OW-VISCapTor: Abstractors for Open-World Video Instance Segmentation and Captioning

要約 私たちは、「オープンワールドビデオインスタンスのセグメンテーションとキャプ … 続きを読む

カテゴリー: cs.AI, cs.CV | OW-VISCapTor: Abstractors for Open-World Video Instance Segmentation and Captioning はコメントを受け付けていません

Convolution goes higher-order: a biologically inspired mechanism empowers image classification

要約 我々は、複雑な非線形生物学的視覚処理に触発された画像分類への新しいアプロー … 続きを読む

カテゴリー: cs.CV, cs.LG, q-bio.NC | Convolution goes higher-order: a biologically inspired mechanism empowers image classification はコメントを受け付けていません

ContRail: A Framework for Realistic Railway Image Synthesis using ControlNet

要約 ディープラーニングは、その並外れた有効性と多くの分野への適用性により、広く … 続きを読む

カテゴリー: cs.AI, cs.CV | ContRail: A Framework for Realistic Railway Image Synthesis using ControlNet はコメントを受け付けていません

3D Graph Attention Networks for High Fidelity Pediatric Glioma Segmentation

要約 小児脳腫瘍、特に神経膠腫は、治療を複雑にする複雑な浸潤性成長パターンを持つ … 続きを読む

カテゴリー: cs.CV | 3D Graph Attention Networks for High Fidelity Pediatric Glioma Segmentation はコメントを受け付けていません

ONEBench to Test Them All: Sample-Level Benchmarking Over Open-Ended Capabilities

要約 従来の固定テスト セットでは、基礎モデルのオープンエンド機能を評価するには … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | ONEBench to Test Them All: Sample-Level Benchmarking Over Open-Ended Capabilities はコメントを受け付けていません

InstantRestore: Single-Step Personalized Face Restoration with Shared-Image Attention

要約 顔画像の復元は、さまざまな劣化の種類、リアルタイム処理の要求、そして最も重 … 続きを読む

カテゴリー: cs.CV | InstantRestore: Single-Step Personalized Face Restoration with Shared-Image Attention はコメントを受け付けていません

Ranking-aware adapter for text-driven image ordering with CLIP

要約 視覚言語モデル (VLM) の最近の進歩により、顔年齢推定や画質評価などの … 続きを読む

カテゴリー: cs.CV | Ranking-aware adapter for text-driven image ordering with CLIP はコメントを受け付けていません

MAtCha Gaussians: Atlas of Charts for High-Quality Geometry and Photorealism From Sparse Views

要約 我々は、明示的な高品質 3D サーフェス メッシュの回復と、疎なビュー サ … 続きを読む

カテゴリー: cs.CV, cs.GR | MAtCha Gaussians: Atlas of Charts for High-Quality Geometry and Photorealism From Sparse Views はコメントを受け付けていません