cs.CV」カテゴリーアーカイブ

Mitigating Hallucinations in Large Vision-Language Models via Entity-Centric Multimodal Preference Optimization

要約 大規模な視覚言語モデル(LVLMS)は、複数のタスクにわたって印象的な機能 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | コメントする

EV-Flying: an Event-based Dataset for In-The-Wild Recognition of Flying Objects

要約 航空物体の監視は、セキュリティ、野生生物の保全、環境研究に不可欠です。 従 … 続きを読む

カテゴリー: cs.CV | コメントする

Video Deblurring with Deconvolution and Aggregation Networks

要約 シングルイメージのデブリングとは対照的に、ビデオデブリングには、ターゲット … 続きを読む

カテゴリー: cs.CV | コメントする

Towards generating more interpretable counterfactuals via concept vectors: a preliminary study on chest X-rays

要約 医療イメージングモデルを展開するための重要なステップは、臨床的知識と解釈可 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | コメントする

Optimal Transport-based Domain Alignment as a Preprocessing Step for Federated Learning

要約 Federated Learning(FL)は、中央サーバーとローカルデー … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Point Cloud Quality Assessment Using the Perceptual Clustering Weighted Graph (PCW-Graph) and Attention Fusion Network

要約 参照モデルのない点群品質評価(NR-PCQA)は、参照モデルが利用できない … 続きを読む

カテゴリー: cs.CV | コメントする

Multimodal Tabular Reasoning with Privileged Structured Information

要約 表形式の推論には、表形式データに対するマルチステップ情報抽出と論理的推論が … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントする

MammAlps: A multi-view video behavior monitoring dataset of wild mammals in the Swiss Alps

要約 野生生物の監視は、特に生態系に対する人間の影響の増加に照らして、生態学と理 … 続きを読む

カテゴリー: cs.CV, cs.IR, q-bio.NC, q-bio.QM | コメントする

GlobalBuildingAtlas: An Open Global and Complete Dataset of Building Polygons, Heights and LoD1 3D Models

要約 GlobalBuildingatlasを紹介します。GlobalBuild … 続きを読む

カテゴリー: cs.CV | コメントする

Multi-view Surface Reconstruction Using Normal and Reflectance Cues

要約 特に複雑な反射特性を備えた材料の存在下で、密なビューセットアップなしで、微 … 続きを読む

カテゴリー: cs.CV | コメントする