月別アーカイブ: 2024年8月

On Learnable Parameters of Optimal and Suboptimal Deep Learning Models

要約 私たちは、特に学習可能なパラメーター (重み) 統計、分布、ノードの相互作 … 続きを読む

カテゴリー: cs.CV, cs.LG | On Learnable Parameters of Optimal and Suboptimal Deep Learning Models はコメントを受け付けていません

Iterative Object Count Optimization for Text-to-image Diffusion Models

要約 私たちは、指定された数のオブジェクトを正確に生成するという、テキストから画 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | Iterative Object Count Optimization for Text-to-image Diffusion Models はコメントを受け付けていません

CMAB: A First National-Scale Multi-Attribute Building Dataset in China Derived from Open Source Data and GeoAI

要約 正確な都市分析、シミュレーション、政策更新には、屋上、高さ、向きなどの幾何 … 続きを読む

カテゴリー: cs.CV, I.4.9 | CMAB: A First National-Scale Multi-Attribute Building Dataset in China Derived from Open Source Data and GeoAI はコメントを受け付けていません

Enhancing Cross-Modal Medical Image Segmentation through Compositionality

要約 異なる画像モダリティによって生成される画像の解像度、コントラスト、解剖学的 … 続きを読む

カテゴリー: cs.CV | Enhancing Cross-Modal Medical Image Segmentation through Compositionality はコメントを受け付けていません

Predicting Gradient is Better: Exploring Self-Supervised Learning for SAR ATR with a Joint-Embedding Predictive Architecture

要約 増大する合成開口レーダー (SAR) データには、自己教師あり学習 (SS … 続きを読む

カテゴリー: cs.CV, eess.IV | Predicting Gradient is Better: Exploring Self-Supervised Learning for SAR ATR with a Joint-Embedding Predictive Architecture はコメントを受け付けていません

SOAP: Enhancing Spatio-Temporal Relation and Motion Information Capturing for Few-Shot Action Recognition

要約 動作認識の高フレームレート (HFR) ビデオは、時空間関係と動作情報密度 … 続きを読む

カテゴリー: cs.AI, cs.CV | SOAP: Enhancing Spatio-Temporal Relation and Motion Information Capturing for Few-Shot Action Recognition はコメントを受け付けていません

CluMo: Cluster-based Modality Fusion Prompt for Continual Learning in Visual Question Answering

要約 大規模ビジョン言語モデル (VLM) は、さまざまなアプリケーション ドメ … 続きを読む

カテゴリー: cs.AI, cs.CV | CluMo: Cluster-based Modality Fusion Prompt for Continual Learning in Visual Question Answering はコメントを受け付けていません

JieHua Paintings Style Feature Extracting Model using Stable Diffusion with ControlNet

要約 この研究は、Jiehua の文体的特徴を抽出するための新しいアプローチ、つ … 続きを読む

カテゴリー: cs.AI, cs.CV | JieHua Paintings Style Feature Extracting Model using Stable Diffusion with ControlNet はコメントを受け付けていません

Open-Ended 3D Point Cloud Instance Segmentation

要約 Open-Vocab 3D インスタンス セグメンテーション手法 (OV- … 続きを読む

カテゴリー: cs.AI, cs.CV | Open-Ended 3D Point Cloud Instance Segmentation はコメントを受け付けていません

DH-Bench: Probing Depth and Height Perception of Large Visual-Language Models

要約 幾何学的な理解は、私たちの環境をナビゲートし、環境と対話するために不可欠で … 続きを読む

カテゴリー: cs.CV | DH-Bench: Probing Depth and Height Perception of Large Visual-Language Models はコメントを受け付けていません