cs.CV」カテゴリーアーカイブ

A Methodology to Evaluate Strategies Predicting Rankings on Unseen Domains

要約 多くの場合、複数のエンティティ(メソッド、アルゴリズム、手順、ソリューショ … 続きを読む

カテゴリー: cs.CV, cs.PF | A Methodology to Evaluate Strategies Predicting Rankings on Unseen Domains はコメントを受け付けていません

Aggregation Schemes for Single-Vector WSI Representation Learning in Digital Pathology

要約 計算病理学で全体のスライド画像(WSI)を効率的に統合するための重要なステ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, eess.IV, q-bio.QM | Aggregation Schemes for Single-Vector WSI Representation Learning in Digital Pathology はコメントを受け付けていません

LENS: Multi-level Evaluation of Multimodal Reasoning with Large Language Models

要約 マルチモーダル大手言語モデル(MLLM)は、視覚的および言語情報の統合に大 … 続きを読む

カテゴリー: cs.CV | LENS: Multi-level Evaluation of Multimodal Reasoning with Large Language Models はコメントを受け付けていません

SNAP: A Benchmark for Testing the Effects of Capture Conditions on Fundamental Vision Tasks

要約 Deep-Rearningベースの(DL)コンピュータービジョンアルゴリズ … 続きを読む

カテゴリー: cs.CV | SNAP: A Benchmark for Testing the Effects of Capture Conditions on Fundamental Vision Tasks はコメントを受け付けていません

Oral Imaging for Malocclusion Issues Assessments: OMNI Dataset, Deep Learning Baselines and Benchmarking

要約 不正咬合は歯科矯正の主要な課題であり、その複雑な症状と多様な臨床症状により … 続きを読む

カテゴリー: cs.CV | Oral Imaging for Malocclusion Issues Assessments: OMNI Dataset, Deep Learning Baselines and Benchmarking はコメントを受け付けていません

FragFake: A Dataset for Fine-Grained Detection of Edited Images with Vision Language Models

要約 特に、最新の拡散モデルと画像編集方法が非常に現実的な操作を生成する可能性が … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV | FragFake: A Dataset for Fine-Grained Detection of Edited Images with Vision Language Models はコメントを受け付けていません

How far can we go with ImageNet for Text-to-Image generation?

要約 最近のテキストからイメージの生成モデルは、「より大きなISが優れている」パ … 続きを読む

カテゴリー: cs.CV | How far can we go with ImageNet for Text-to-Image generation? はコメントを受け付けていません

The Devil is in Fine-tuning and Long-tailed Problems:A New Benchmark for Scene Text Detection

要約 シーンのテキスト検出では、アカデミックベンチマークで優れた高性能な方法の出 … 続きを読む

カテゴリー: cs.CV | The Devil is in Fine-tuning and Long-tailed Problems:A New Benchmark for Scene Text Detection はコメントを受け付けていません

Exploring the Limits of Vision-Language-Action Manipulations in Cross-task Generalization

要約 目に見えないタスクに対するビジョン言語アクション(VLA)モデルの一般化能 … 続きを読む

カテゴリー: cs.CV, cs.RO | Exploring the Limits of Vision-Language-Action Manipulations in Cross-task Generalization はコメントを受け付けていません

Gompertz Linear Units: Leveraging Asymmetry for Enhanced Learning Dynamics

要約 活性化関数は、トレーニングのダイナミクスに大きな影響を与えるため、深い学習 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Gompertz Linear Units: Leveraging Asymmetry for Enhanced Learning Dynamics はコメントを受け付けていません