月別アーカイブ: 2025年1月

Generate, Transduct, Adapt: Iterative Transduction with VLMs

要約 視覚言語モデルを使用したトランスダクティブ ゼロショット学習では、データセ … 続きを読む

カテゴリー: cs.CV | Generate, Transduct, Adapt: Iterative Transduction with VLMs はコメントを受け付けていません

Nonisotropic Gaussian Diffusion for Realistic 3D Human Motion Prediction

要約 確率的な人間の動きの予測は、過去の観察から将来起こり得る複数の動きを予測す … 続きを読む

カテゴリー: cs.CV | Nonisotropic Gaussian Diffusion for Realistic 3D Human Motion Prediction はコメントを受け付けていません

A Holistically Point-guided Text Framework for Weakly-Supervised Camouflaged Object Detection

要約 弱教師カモフラージュ物体検出 (WSCOD) は、弱いラベルを使用してモデ … 続きを読む

カテゴリー: cs.CV | A Holistically Point-guided Text Framework for Weakly-Supervised Camouflaged Object Detection はコメントを受け付けていません

AI-powered virtual tissues from spatial proteomics for clinical diagnostics and biomedical discovery

要約 空間プロテオミクス技術は、複数の分子マーカーとその空間構成の同時分析を可能 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, q-bio.QM | AI-powered virtual tissues from spatial proteomics for clinical diagnostics and biomedical discovery はコメントを受け付けていません

MSCViT: A Small-size ViT architecture with Multi-Scale Self-Attention Mechanism for Tiny Datasets

要約 Vision Transformer (ViT) は、長距離の依存関係をモ … 続きを読む

カテゴリー: cs.CV | MSCViT: A Small-size ViT architecture with Multi-Scale Self-Attention Mechanism for Tiny Datasets はコメントを受け付けていません

Enhancing, Refining, and Fusing: Towards Robust Multi-Scale and Dense Ship Detection

要約 合成開口レーダー (SAR) イメージングは​​、その高解像度、全天候機能 … 続きを読む

カテゴリー: cs.CV | Enhancing, Refining, and Fusing: Towards Robust Multi-Scale and Dense Ship Detection はコメントを受け付けていません

Dr. Tongue: Sign-Oriented Multi-label Detection for Remote Tongue Diagnosis

要約 舌診断は西洋医学および伝統的中国医学において重要なツールであり、舌の特性を … 続きを読む

カテゴリー: cs.CV, eess.IV | Dr. Tongue: Sign-Oriented Multi-label Detection for Remote Tongue Diagnosis はコメントを受け付けていません

Advances in Diffusion Models for Image Data Augmentation: A Review of Methods, Models, Evaluation Metrics and Future Research Directions

要約 画像データの拡張は、トレーニング データセットの多様性と品質の向上を促進で … 続きを読む

カテゴリー: cs.AI, cs.CV | Advances in Diffusion Models for Image Data Augmentation: A Review of Methods, Models, Evaluation Metrics and Future Research Directions はコメントを受け付けていません

BIV-Priv-Seg: Locating Private Content in Images Taken by People With Visual Impairments

要約 視覚障害者またはロービジョン (BLV) のある人が、自分が撮った写真を共 … 続きを読む

カテゴリー: cs.CV | BIV-Priv-Seg: Locating Private Content in Images Taken by People With Visual Impairments はコメントを受け付けていません

FaceMe: Robust Blind Face Restoration with Personal Identification

要約 ブラインドフェイスの復元は、必要なコンテキストが欠如しているため、非常に不 … 続きを読む

カテゴリー: cs.CV | FaceMe: Robust Blind Face Restoration with Personal Identification はコメントを受け付けていません