月別アーカイブ: 2025年3月

Euclid Quick Data Release (Q1). Active galactic nuclei identification using diffusion-based inpainting of Euclid VIS images

要約 銀河からの光放出は、銀河タイプ、構造的特徴、他の銀河との相互作用などの要因 … 続きを読む

カテゴリー: astro-ph.GA, cs.CV | Euclid Quick Data Release (Q1). Active galactic nuclei identification using diffusion-based inpainting of Euclid VIS images はコメントを受け付けていません

Recover and Match: Open-Vocabulary Multi-Label Recognition through Knowledge-Constrained Optimal Transport

要約 画像内の複数の新規クラスを識別することは、オープンボキャブラリーマルチラベ … 続きを読む

カテゴリー: cs.CV | Recover and Match: Open-Vocabulary Multi-Label Recognition through Knowledge-Constrained Optimal Transport はコメントを受け付けていません

Data-Free Dynamic Compression of CNNs for Tractable Efficiency

要約 リソース制約のデバイスでの畳み込みニューラルネットワーク(CNNS)の計算 … 続きを読む

カテゴリー: cs.CV, cs.LG | Data-Free Dynamic Compression of CNNs for Tractable Efficiency はコメントを受け付けていません

FlowTok: Flowing Seamlessly Across Text and Image Tokens

要約 異なるモダリティを橋渡しすることは、クロスモダリティ世代の中心にあります。 … 続きを読む

カテゴリー: cs.CV | FlowTok: Flowing Seamlessly Across Text and Image Tokens はコメントを受け付けていません

TruthLens:A Training-Free Paradigm for DeepFake Detection

要約 高度なAIモデルによって生成された合成画像の増殖は、操作された視覚コンテン … 続きを読む

カテゴリー: cs.AI, cs.CV | TruthLens:A Training-Free Paradigm for DeepFake Detection はコメントを受け付けていません

Leveraging Perfect Multimodal Alignment and Gaussian Assumptions for Cross-modal Transfer

要約 Multimodal Alignmentは、同じベクトルに同じ概念マップを … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.SP | Leveraging Perfect Multimodal Alignment and Gaussian Assumptions for Cross-modal Transfer はコメントを受け付けていません

SemEval-2025 Task 1: AdMIRe — Advancing Multimodal Idiomaticity Representation

要約 慣用的な表現は、NLPにユニークな課題を提示します。その意味は、構成要素の … 続きを読む

カテゴリー: cs.CL, cs.CV, I.2.7 | SemEval-2025 Task 1: AdMIRe — Advancing Multimodal Idiomaticity Representation はコメントを受け付けていません

Boosting HDR Image Reconstruction via Semantic Knowledge Transfer

要約 LDR画像が顕著な分解と欠落コンテンツを示すと、複数の低ダイナミックレンジ … 続きを読む

カテゴリー: cs.CV | Boosting HDR Image Reconstruction via Semantic Knowledge Transfer はコメントを受け付けていません

EfficientLLaVA:Generalizable Auto-Pruning for Large Vision-language Models

要約 マルチモーダルの大規模な言語モデルは、複雑な推論タスクで強力なパフォーマン … 続きを読む

カテゴリー: cs.CV | EfficientLLaVA:Generalizable Auto-Pruning for Large Vision-language Models はコメントを受け付けていません

Safety at Scale: A Comprehensive Survey of Large Model Safety

要約 大規模な事前トレーニングによる学習と一般化における並外れた能力によって推進 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.CV | Safety at Scale: A Comprehensive Survey of Large Model Safety はコメントを受け付けていません