月別アーカイブ: 2025年3月

Euclid Quick Data Release (Q1). Active galactic nuclei identification using diffusion-based inpainting of Euclid VIS images

投稿日: 2025年3月20日作成者: jarxiv

要約銀河からの光放出は、銀河タイプ、構造的特徴、他の銀河との相互作用などの要因 … 続きを読む →

カテゴリー: astro-ph.GA, cs.CV | コメントを受け付けていません

Recover and Match: Open-Vocabulary Multi-Label Recognition through Knowledge-Constrained Optimal Transport

投稿日: 2025年3月20日作成者: jarxiv

要約画像内の複数の新規クラスを識別することは、オープンボキャブラリーマルチラベ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Data-Free Dynamic Compression of CNNs for Tractable Efficiency

投稿日: 2025年3月20日作成者: jarxiv

要約リソース制約のデバイスでの畳み込みニューラルネットワーク（CNNS）の計算 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

FlowTok: Flowing Seamlessly Across Text and Image Tokens

投稿日: 2025年3月20日作成者: jarxiv

要約異なるモダリティを橋渡しすることは、クロスモダリティ世代の中心にあります。 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

TruthLens:A Training-Free Paradigm for DeepFake Detection

投稿日: 2025年3月20日作成者: jarxiv

要約高度なAIモデルによって生成された合成画像の増殖は、操作された視覚コンテン … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Leveraging Perfect Multimodal Alignment and Gaussian Assumptions for Cross-modal Transfer

投稿日: 2025年3月20日作成者: jarxiv

要約 Multimodal Alignmentは、同じベクトルに同じ概念マップを … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, eess.SP | コメントを受け付けていません

SemEval-2025 Task 1: AdMIRe — Advancing Multimodal Idiomaticity Representation

投稿日: 2025年3月20日作成者: jarxiv

要約慣用的な表現は、NLPにユニークな課題を提示します。その意味は、構成要素の … 続きを読む →

カテゴリー: cs.CL, cs.CV, I.2.7 | コメントを受け付けていません

Boosting HDR Image Reconstruction via Semantic Knowledge Transfer

投稿日: 2025年3月20日作成者: jarxiv

要約 LDR画像が顕著な分解と欠落コンテンツを示すと、複数の低ダイナミックレンジ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

EfficientLLaVA:Generalizable Auto-Pruning for Large Vision-language Models

投稿日: 2025年3月20日作成者: jarxiv

要約マルチモーダルの大規模な言語モデルは、複雑な推論タスクで強力なパフォーマン … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Safety at Scale: A Comprehensive Survey of Large Model Safety

投稿日: 2025年3月20日作成者: jarxiv

要約大規模な事前トレーニングによる学習と一般化における並外れた能力によって推進 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR, cs.CV | コメントを受け付けていません

月別アーカイブ: 2025年3月

Euclid Quick Data Release (Q1). Active galactic nuclei identification using diffusion-based inpainting of Euclid VIS images

Recover and Match: Open-Vocabulary Multi-Label Recognition through Knowledge-Constrained Optimal Transport

Data-Free Dynamic Compression of CNNs for Tractable Efficiency

FlowTok: Flowing Seamlessly Across Text and Image Tokens

TruthLens:A Training-Free Paradigm for DeepFake Detection

Leveraging Perfect Multimodal Alignment and Gaussian Assumptions for Cross-modal Transfer

SemEval-2025 Task 1: AdMIRe — Advancing Multimodal Idiomaticity Representation

Boosting HDR Image Reconstruction via Semantic Knowledge Transfer

EfficientLLaVA:Generalizable Auto-Pruning for Large Vision-language Models

Safety at Scale: A Comprehensive Survey of Large Model Safety

最近の投稿

最近のコメント

アーカイブ

カテゴリー