cs.CV」カテゴリーアーカイブ

Nearest Neighbor Classification for Classical Image Upsampling

要約 画像の形式で順序付けされた一連のピクセル データが与えられた場合、私たちの … 続きを読む

カテゴリー: cs.CV, cs.GR | Nearest Neighbor Classification for Classical Image Upsampling はコメントを受け付けていません

SLCA++: Unleash the Power of Sequential Fine-tuning for Continual Learning with Pre-training

要約 近年、ゼロからトレーニングするという従来の焦点に代わって、事前トレーニング … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | SLCA++: Unleash the Power of Sequential Fine-tuning for Continual Learning with Pre-training はコメントを受け付けていません

Towards Flexible Visual Relationship Segmentation

要約 視覚的関係の理解は、人間とオブジェクトの相互作用 (HOI) 検出、シーン … 続きを読む

カテゴリー: cs.CV | Towards Flexible Visual Relationship Segmentation はコメントを受け付けていません

Understanding the Local Geometry of Generative Model Manifolds

要約 深い生成モデルは、トレーニング中に有限数のサンプルを使用して複雑なデータ多 … 続きを読む

カテゴリー: cs.CV, cs.LG | Understanding the Local Geometry of Generative Model Manifolds はコメントを受け付けていません

Can Large Language Models Understand Symbolic Graphics Programs?

要約 大規模言語モデル (LLM) の機能を評価することは、多くの場合困難です。 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Can Large Language Models Understand Symbolic Graphics Programs? はコメントを受け付けていません

A Spitting Image: Modular Superpixel Tokenization in Vision Transformers

要約 Vision Transformer (ViT) アーキテクチャは伝統的に … 続きを読む

カテゴリー: 68T45, cs.AI, cs.CV, cs.LG, I.2.10 | A Spitting Image: Modular Superpixel Tokenization in Vision Transformers はコメントを受け付けていません

A Semantic Space is Worth 256 Language Descriptions: Make Stronger Segmentation Models with Descriptive Properties

要約 このペーパーでは、強力な解釈可能なセグメンテーション モデルを作成するため … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | A Semantic Space is Worth 256 Language Descriptions: Make Stronger Segmentation Models with Descriptive Properties はコメントを受け付けていません

MathScape: Evaluating MLLMs in multimodal Math Scenarios through a Hierarchical Benchmark

要約 マルチモーダル大規模言語モデル (MLLM) の開発により、数学的問題に関 … 続きを読む

カテゴリー: cs.CL, cs.CV | MathScape: Evaluating MLLMs in multimodal Math Scenarios through a Hierarchical Benchmark はコメントを受け付けていません

MetaSeg: MetaFormer-based Global Contexts-aware Network for Efficient Semantic Segmentation

要約 Transformer を超えて、Transformer のパフォーマンス … 続きを読む

カテゴリー: cs.AI, cs.CV | MetaSeg: MetaFormer-based Global Contexts-aware Network for Efficient Semantic Segmentation はコメントを受け付けていません

DIffSteISR: Harnessing Diffusion Prior for Superior Real-world Stereo Image Super-Resolution

要約 現実世界のステレオ画像を再構成するための先駆的なフレームワークである Di … 続きを読む

カテゴリー: cs.CV, eess.IV | DIffSteISR: Harnessing Diffusion Prior for Superior Real-world Stereo Image Super-Resolution はコメントを受け付けていません