cs.CV」カテゴリーアーカイブ

Data Augmentation via Latent Diffusion for Saliency Prediction

要約 顕著性予測モデルは、ラベル付きデータの多様性と量が限られているという制約を … 続きを読む

カテゴリー: cs.CV | Data Augmentation via Latent Diffusion for Saliency Prediction はコメントを受け付けていません

Medical diffusion on a budget: Textual Inversion for medical image generation

要約 効率性、アクセシビリティ、品質で知られるテキストから画像への生成の普及モデ … 続きを読む

カテゴリー: cs.CV, eess.IV | Medical diffusion on a budget: Textual Inversion for medical image generation はコメントを受け付けていません

Module-wise Adaptive Adversarial Training for End-to-end Autonomous Driving

要約 深層学習の最近の進歩により、自動運転 (AD) モデル、特に認識、予測、計 … 続きを読む

カテゴリー: cs.AI, cs.CV | Module-wise Adaptive Adversarial Training for End-to-end Autonomous Driving はコメントを受け付けていません

Current Symmetry Group Equivariant Convolution Frameworks for Representation Learning

要約 ユークリッド深層学習は、表現空間が不規則で複雑なトポロジーで湾曲している現 … 続きを読む

カテゴリー: cs.CV, cs.LG | Current Symmetry Group Equivariant Convolution Frameworks for Representation Learning はコメントを受け付けていません

Learning to Compress Contexts for Efficient Knowledge-based Visual Question Answering

要約 マルチモーダル大規模言語モデル (MLLM) は、ビジュアル質問応答 (V … 続きを読む

カテゴリー: cs.CV, cs.LG | Learning to Compress Contexts for Efficient Knowledge-based Visual Question Answering はコメントを受け付けていません

Benchmarking 2D Egocentric Hand Pose Datasets

要約 自己中心的なビデオからの手の姿勢の推定は、人間とコンピューターの相互作用、 … 続きを読む

カテゴリー: cs.CV | Benchmarking 2D Egocentric Hand Pose Datasets はコメントを受け付けていません

BeNeRF: Neural Radiance Fields from a Single Blurry Image and Event Stream

要約 ビジュアルシーンのニューラル暗黙的表現は、コンピュータービジョンとグラフィ … 続きを読む

カテゴリー: cs.CV | BeNeRF: Neural Radiance Fields from a Single Blurry Image and Event Stream はコメントを受け付けていません

Federated Impression for Learning with Distributed Heterogeneous Data

要約 標準的な深層学習ベースの分類アプローチは、すべてのサンプルを一元的に収集す … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.DC, cs.LG | Federated Impression for Learning with Distributed Heterogeneous Data はコメントを受け付けていません

Securing Vision-Language Models with a Robust Encoder Against Jailbreak and Adversarial Attacks

要約 マルチモーダルなビッグ データセットでトレーニングされた大規模視覚言語モデ … 続きを読む

カテゴリー: cs.AI, cs.CV | Securing Vision-Language Models with a Robust Encoder Against Jailbreak and Adversarial Attacks はコメントを受け付けていません

Quantifying Knee Cartilage Shape and Lesion: From Image to Metrics

要約 膝関節軟骨の画像特徴は、変形性膝関節症の潜在的な画像バイオマーカーであるこ … 続きを読む

カテゴリー: cs.CV, eess.IV | Quantifying Knee Cartilage Shape and Lesion: From Image to Metrics はコメントを受け付けていません