月別アーカイブ: 2024年7月

OmniGS: Fast Radiance Field Reconstruction using Omnidirectional Gaussian Splatting

要約 3D ガウス スプラッティングに依存したフォトリアリスティックな再構成は、 … 続きを読む

カテゴリー: cs.CV | OmniGS: Fast Radiance Field Reconstruction using Omnidirectional Gaussian Splatting はコメントを受け付けていません

Human-in-the-Loop Visual Re-ID for Population Size Estimation

要約 コンピューター ビジョン ベースの再識別 (Re-ID) システムは、大規 … 続きを読む

カテゴリー: cs.CV | Human-in-the-Loop Visual Re-ID for Population Size Estimation はコメントを受け付けていません

DataDream: Few-shot Guided Dataset Generation

要約 テキストから画像への拡散モデルは、画像合成において最先端の結果を達成するこ … 続きを読む

カテゴリー: cs.CV, cs.LG | DataDream: Few-shot Guided Dataset Generation はコメントを受け付けていません

GOEmbed: Gradient Origin Embeddings for Representation Agnostic 3D Feature Learning

要約 オブジェクトの 2D ビューからの情報を 3D 表現にエンコードすることは … 続きを読む

カテゴリー: cs.CV, cs.GR | GOEmbed: Gradient Origin Embeddings for Representation Agnostic 3D Feature Learning はコメントを受け付けていません

Parrot: Pareto-optimal Multi-Reward Reinforcement Learning Framework for Text-to-Image Generation

要約 最近の研究では、複数の品質報酬を伴う強化学習 (RL) を使用すると、テキ … 続きを読む

カテゴリー: cs.CV | Parrot: Pareto-optimal Multi-Reward Reinforcement Learning Framework for Text-to-Image Generation はコメントを受け付けていません

PartImageNet++ Dataset: Scaling up Part-based Models for Robust Recognition

要約 深層学習ベースの物体認識システムは、さまざまな敵対的な摂動によって簡単にだ … 続きを読む

カテゴリー: cs.CV | PartImageNet++ Dataset: Scaling up Part-based Models for Robust Recognition はコメントを受け付けていません

Benchmarking Vision Language Models for Cultural Understanding

要約 基礎モデルと視覚言語の事前トレーニングには、特に高度な視覚言語モデル (V … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Benchmarking Vision Language Models for Cultural Understanding はコメントを受け付けていません

A Dual-Attention Aware Deep Convolutional Neural Network for Early Alzheimer’s Detection

要約 アルツハイマー病 (AD) は神経変性の主要な形態であり、毎年数百万人が罹 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, F.2.2, I.2.7 | A Dual-Attention Aware Deep Convolutional Neural Network for Early Alzheimer’s Detection はコメントを受け付けていません

OPa-Ma: Text Guided Mamba for 360-degree Image Out-painting

要約 この論文では、単一のカメラまたは携帯電話で撮影できる従来の狭視野 (NFo … 続きを読む

カテゴリー: cs.CV | OPa-Ma: Text Guided Mamba for 360-degree Image Out-painting はコメントを受け付けていません

In-Loop Filtering via Trained Look-Up Tables

要約 インループ フィルタリング (ILF) は、画像/ビデオ コーディング規格 … 続きを読む

カテゴリー: cs.CV, eess.IV | In-Loop Filtering via Trained Look-Up Tables はコメントを受け付けていません