月別アーカイブ: 2024年4月

LaSagnA: Language-based Segmentation Assistant for Complex Queries

要約 最近の進歩により、Large Language Models for Vi … 続きを読む

カテゴリー: cs.CV | LaSagnA: Language-based Segmentation Assistant for Complex Queries はコメントを受け付けていません

Identifying Important Group of Pixels using Interactions

要約 画像分類器の動作をより深く理解するには、モデル予測に対する個々のピクセルの … 続きを読む

カテゴリー: cs.CV, cs.LG | Identifying Important Group of Pixels using Interactions はコメントを受け付けていません

NIR-Assisted Image Denoising: A Selective Fusion Approach and A Real-World Benchmark Datase

要約 画像のノイズ除去が大幅に進歩したにもかかわらず、特に極度に暗い環境において … 続きを読む

カテゴリー: cs.CV | NIR-Assisted Image Denoising: A Selective Fusion Approach and A Real-World Benchmark Datase はコメントを受け付けていません

ChatGPT and general-purpose AI count fruits in pictures surprisingly well

要約 オブジェクトのカウントは、農業を含むさまざまな分野のディープ ラーニング … 続きを読む

カテゴリー: cs.CV, eess.IV | ChatGPT and general-purpose AI count fruits in pictures surprisingly well はコメントを受け付けていません

SpikeNVS: Enhancing Novel View Synthesis from Blurry Images via Spike Camera

要約 Neural Radiance Fields (NeRF) や 3D Ga … 続きを読む

カテゴリー: cs.AI, cs.CV | SpikeNVS: Enhancing Novel View Synthesis from Blurry Images via Spike Camera はコメントを受け付けていません

View-Consistent 3D Editing with Gaussian Splatting

要約 3D ガウス スプラッティング (3DGS) の出現は 3D 編集に革命を … 続きを読む

カテゴリー: cs.CV, cs.GR | View-Consistent 3D Editing with Gaussian Splatting はコメントを受け付けていません

Masked Image Modeling as a Framework for Self-Supervised Learning across Eye Movements

要約 周囲の状況を理解するために、インテリジェント システムは、複雑な感覚入力を … 続きを読む

カテゴリー: cs.CV | Masked Image Modeling as a Framework for Self-Supervised Learning across Eye Movements はコメントを受け付けていません

A novel Fourier neural operator framework for classification of multi-sized images: Application to three dimensional digital porous media

要約 フーリエ ニューラル オペレーター (FNO) は入力画像のサイズに関して … 続きを読む

カテゴリー: cs.CV | A novel Fourier neural operator framework for classification of multi-sized images: Application to three dimensional digital porous media はコメントを受け付けていません

Text Prompt with Normality Guidance for Weakly Supervised Video Anomaly Detection

要約 弱監視ビデオ異常検出 (WSVAD) は困難なタスクです。 弱いラベルに基 … 続きを読む

カテゴリー: cs.CV | Text Prompt with Normality Guidance for Weakly Supervised Video Anomaly Detection はコメントを受け付けていません

Generalized Contrastive Learning for Multi-Modal Retrieval and Ranking

要約 対照学習は、手動による注釈の要件が最小限であるため、検索タスクに広く採用さ … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.LG | Generalized Contrastive Learning for Multi-Modal Retrieval and Ranking はコメントを受け付けていません