cs.CV」カテゴリーアーカイブ

Efficient Leaf Disease Classification and Segmentation using Midpoint Normalization Technique and Attention Mechanism

要約 葉の画像からの植物疾患の検出の強化は、標識データが不足していることと複雑な … 続きを読む

カテゴリー: cs.CV, eess.IV | Efficient Leaf Disease Classification and Segmentation using Midpoint Normalization Technique and Attention Mechanism はコメントを受け付けていません

efunc: An Efficient Function Representation without Neural Networks

要約 関数フィッティング/近似は、コンピューターグラフィックスおよびその他のエン … 続きを読む

カテゴリー: cs.CV, cs.GR | efunc: An Efficient Function Representation without Neural Networks はコメントを受け付けていません

MagicTryOn: Harnessing Diffusion Transformer for Garment-Preserving Video Virtual Try-on

要約 Video Virtual Try-On(VVT)は、連続したビデオフレー … 続きを読む

カテゴリー: cs.CV | MagicTryOn: Harnessing Diffusion Transformer for Garment-Preserving Video Virtual Try-on はコメントを受け付けていません

MME-Reasoning: A Comprehensive Benchmark for Logical Reasoning in MLLMs

要約 論理的推論は、人間の知性の基本的な側面であり、マルチモーダル大手言語モデル … 続きを読む

カテゴリー: cs.AI, cs.CV | MME-Reasoning: A Comprehensive Benchmark for Logical Reasoning in MLLMs はコメントを受け付けていません

One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation

要約 スーパー解像度(SR)の拡散モデルは、高品質の視覚的結果を生成しますが、高 … 続きを読む

カテゴリー: cs.CV | One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation はコメントを受け付けていません

MME-VideoOCR: Evaluating OCR-Based Capabilities of Multimodal LLMs in Video Scenarios

要約 マルチモーダル大手言語モデル(MLLM)は、静的画像から光学文字認識(OC … 続きを読む

カテゴリー: cs.CV | MME-VideoOCR: Evaluating OCR-Based Capabilities of Multimodal LLMs in Video Scenarios はコメントを受け付けていません

HoliTom: Holistic Token Merging for Fast Video Large Language Models

要約 ビデオ大規模な言語モデル(ビデオLLM)はビデオ理解に優れていますが、冗長 … 続きを読む

カテゴリー: cs.CV | HoliTom: Holistic Token Merging for Fast Video Large Language Models はコメントを受け付けていません

Structure from Collision

要約 ニューラル放射輝度フィールド(NERF)や3Dガウススプラッティング(3D … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG, cs.RO | Structure from Collision はコメントを受け付けていません

Regularized Personalization of Text-to-Image Diffusion Models without Distributional Drift

要約 テキストから画像への拡散モデルを使用したパーソナライズには、少数の画像例を … 続きを読む

カテゴリー: cs.CV | Regularized Personalization of Text-to-Image Diffusion Models without Distributional Drift はコメントを受け付けていません

Beyond Accuracy: Uncovering the Role of Similarity Perception and its Alignment with Semantics in Supervised Learning

要約 類似性は、特に重要なセマンティックな類似性を含むさまざまな形で現れ、例えば … 続きを読む

カテゴリー: cs.CV | Beyond Accuracy: Uncovering the Role of Similarity Perception and its Alignment with Semantics in Supervised Learning はコメントを受け付けていません