「cs.CV」カテゴリーアーカイブ

VP-MEL: Visual Prompts Guided Multimodal Entity Linking

投稿日: 2024年12月10日作成者: jarxiv

要約マルチモーダルエンティティリンク (MEL) は、情報検索の分野で広く … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Take Fake as Real: Realistic-like Robust Black-box Adversarial Attack to Evade AIGC Detection

投稿日: 2024年12月10日作成者: jarxiv

要約 GAN と拡散モデルに基づく AI 生成コンテンツ (AIGC) 検出のセ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

OW-VISCapTor: Abstractors for Open-World Video Instance Segmentation and Captioning

投稿日: 2024年12月10日作成者: jarxiv

要約私たちは、「オープンワールドビデオインスタンスのセグメンテーションとキャプ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Convolution goes higher-order: a biologically inspired mechanism empowers image classification

投稿日: 2024年12月10日作成者: jarxiv

要約我々は、複雑な非線形生物学的視覚処理に触発された画像分類への新しいアプロー … 続きを読む →

カテゴリー: cs.CV, cs.LG, q-bio.NC | コメントを受け付けていません

ContRail: A Framework for Realistic Railway Image Synthesis using ControlNet

投稿日: 2024年12月10日作成者: jarxiv

要約ディープラーニングは、その並外れた有効性と多くの分野への適用性により、広く … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

3D Graph Attention Networks for High Fidelity Pediatric Glioma Segmentation

投稿日: 2024年12月10日作成者: jarxiv

要約小児脳腫瘍、特に神経膠腫は、治療を複雑にする複雑な浸潤性成長パターンを持つ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

ONEBench to Test Them All: Sample-Level Benchmarking Over Open-Ended Capabilities

投稿日: 2024年12月10日作成者: jarxiv

要約従来の固定テストセットでは、基礎モデルのオープンエンド機能を評価するには … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

InstantRestore: Single-Step Personalized Face Restoration with Shared-Image Attention

投稿日: 2024年12月10日作成者: jarxiv

要約顔画像の復元は、さまざまな劣化の種類、リアルタイム処理の要求、そして最も重 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Ranking-aware adapter for text-driven image ordering with CLIP

投稿日: 2024年12月10日作成者: jarxiv

要約視覚言語モデル (VLM) の最近の進歩により、顔年齢推定や画質評価などの … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

MAtCha Gaussians: Atlas of Charts for High-Quality Geometry and Photorealism From Sparse Views

投稿日: 2024年12月10日作成者: jarxiv

要約我々は、明示的な高品質 3D サーフェスメッシュの回復と、疎なビューサ … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

VP-MEL: Visual Prompts Guided Multimodal Entity Linking

Take Fake as Real: Realistic-like Robust Black-box Adversarial Attack to Evade AIGC Detection

OW-VISCapTor: Abstractors for Open-World Video Instance Segmentation and Captioning

Convolution goes higher-order: a biologically inspired mechanism empowers image classification

ContRail: A Framework for Realistic Railway Image Synthesis using ControlNet

3D Graph Attention Networks for High Fidelity Pediatric Glioma Segmentation

ONEBench to Test Them All: Sample-Level Benchmarking Over Open-Ended Capabilities

InstantRestore: Single-Step Personalized Face Restoration with Shared-Image Attention

Ranking-aware adapter for text-driven image ordering with CLIP

MAtCha Gaussians: Atlas of Charts for High-Quality Geometry and Photorealism From Sparse Views

最近の投稿

最近のコメント

アーカイブ

カテゴリー