cs.CV」カテゴリーアーカイブ

P-TAME: Explain Any Image Classifier with Trained Perturbations

要約 予測を正当化する必要がある重要な分野での深いニューラルネットワーク(DNN … 続きを読む

カテゴリー: cs.AI, cs.CV | P-TAME: Explain Any Image Classifier with Trained Perturbations はコメントを受け付けていません

SSF: Sparse Long-Range Scene Flow for Autonomous Driving

要約 シーンフローにより、3D世界の環境の動き特性を理解することができます。 そ … 続きを読む

カテゴリー: cs.CV | SSF: Sparse Long-Range Scene Flow for Autonomous Driving はコメントを受け付けていません

Aggregation Schemes for Single-Vector WSI Representation Learning in Digital Pathology

要約 計算病理学で全体のスライド画像(WSI)を効率的に統合するための重要なステ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, eess.IV, q-bio.QM | Aggregation Schemes for Single-Vector WSI Representation Learning in Digital Pathology はコメントを受け付けていません

U2A: Unified Unimodal Adaptation for Robust and Efficient Multimodal Learning

要約 マルチモーダル学習は、多くの場合、最適なパフォーマンスを実現するために、新 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | U2A: Unified Unimodal Adaptation for Robust and Efficient Multimodal Learning はコメントを受け付けていません

Synthesizing 3D Abstractions by Inverting Procedural Buildings with Transformers

要約 手続きモデルを反転させることを学ぶことにより、建物の抽象化を生成し、それら … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Synthesizing 3D Abstractions by Inverting Procedural Buildings with Transformers はコメントを受け付けていません

PhysBench: Benchmarking and Enhancing Vision-Language Models for Physical World Understanding

要約 物理的な世界を理解することは、具体化されたAIの基本的な課題であり、エージ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | PhysBench: Benchmarking and Enhancing Vision-Language Models for Physical World Understanding はコメントを受け付けていません

Beyond-Labels: Advancing Open-Vocabulary Segmentation With Vision-Language Models

要約 自己学習学習は、効果的に訓練された場合、多数の画像または言語処理の問題を解 … 続きを読む

カテゴリー: cs.CV | Beyond-Labels: Advancing Open-Vocabulary Segmentation With Vision-Language Models はコメントを受け付けていません

GFE-Mamba: Mamba-based AD Multi-modal Progression Assessment via Generative Feature Extraction from MCI

要約 アルツハイマー病(AD)は、しばしば軽度の認知障害(MCI)に由来する進行 … 続きを読む

カテゴリー: cs.AI, cs.CV | GFE-Mamba: Mamba-based AD Multi-modal Progression Assessment via Generative Feature Extraction from MCI はコメントを受け付けていません

PhysBench: Benchmarking and Enhancing Vision-Language Models for Physical World Understanding

要約 物理的な世界を理解することは、具体化されたAIの基本的な課題であり、エージ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | PhysBench: Benchmarking and Enhancing Vision-Language Models for Physical World Understanding はコメントを受け付けていません

BiFold: Bimanual Cloth Folding with Language Guidance

要約 布の折りたたみは、衣服の避けられない自己閉鎖、複雑なダイナミクス、衣服が持 … 続きを読む

カテゴリー: cs.CV, cs.RO | BiFold: Bimanual Cloth Folding with Language Guidance はコメントを受け付けていません