cs.CV」カテゴリーアーカイブ

Deep neural network-based detection of counterfeit products from smartphone images

要約 医薬品やワクチンなどの偽造品や、ファッション性の高いハンドバッグ、時計、宝 … 続きを読む

カテゴリー: cs.CV | Deep neural network-based detection of counterfeit products from smartphone images はコメントを受け付けていません

DMPlug: A Plug-in Method for Solving Inverse Problems with Diffusion Models

要約 事前学習済み拡散モデル (DM) は、最近、逆問題 (IP) を解く際に広 … 続きを読む

カテゴリー: cs.CV, cs.LG | DMPlug: A Plug-in Method for Solving Inverse Problems with Diffusion Models はコメントを受け付けていません

LDTrack: Dynamic People Tracking by Service Robots using Diffusion Models

要約 雑然とした混雑した人間中心の環境でダイナミックな人々を追跡することは、オク … 続きを読む

カテゴリー: cs.CV, cs.RO | LDTrack: Dynamic People Tracking by Service Robots using Diffusion Models はコメントを受け付けていません

Multi-branch Spatio-Temporal Graph Neural Network For Efficient Ice Layer Thickness Prediction

要約 極地の氷層の時空間パターンを理解することは、氷床のバランスの変化を追跡し、 … 続きを読む

カテゴリー: cs.CV, cs.LG | Multi-branch Spatio-Temporal Graph Neural Network For Efficient Ice Layer Thickness Prediction はコメントを受け付けていません

bit2bit: 1-bit quanta video reconstruction via self-supervised photon prediction

要約 SPAD アレイなどの Quanta イメージ センサーは、数ナノ秒という … 続きを読む

カテゴリー: 68T45, cs.CV, cs.LG, eess.IV, I.2.10 | bit2bit: 1-bit quanta video reconstruction via self-supervised photon prediction はコメントを受け付けていません

Pseudo-labeling with Keyword Refining for Few-Supervised Video Captioning

要約 ビデオのキャプションは、ビデオの内容を説明する文章を生成します。 既存の方 … 続きを読む

カテゴリー: cs.CV | Pseudo-labeling with Keyword Refining for Few-Supervised Video Captioning はコメントを受け付けていません

H-POPE: Hierarchical Polling-based Probing Evaluation of Hallucinations in Large Vision-Language Models

要約 ラージ ビジョン言語モデル (LVLM) は、テキストと画像の両方を活用す … 続きを読む

カテゴリー: cs.CV | H-POPE: Hierarchical Polling-based Probing Evaluation of Hallucinations in Large Vision-Language Models はコメントを受け付けていません

Textual Decomposition Then Sub-motion-space Scattering for Open-Vocabulary Motion Generation

要約 テキストからモーションの生成は、コンピューター ビジョンにおいて重要なタス … 続きを読む

カテゴリー: cs.CV | Textual Decomposition Then Sub-motion-space Scattering for Open-Vocabulary Motion Generation はコメントを受け付けていません

Gaussian Deja-vu: Creating Controllable 3D Gaussian Head-Avatars with Enhanced Generalization and Personalization Abilities

要約 3D ガウス スプラッティング (3DGS) の最近の進歩により、3D 頭 … 続きを読む

カテゴリー: cs.CV | Gaussian Deja-vu: Creating Controllable 3D Gaussian Head-Avatars with Enhanced Generalization and Personalization Abilities はコメントを受け付けていません

RaVL: Discovering and Mitigating Spurious Correlations in Fine-Tuned Vision-Language Models

要約 微調整された視覚言語モデル (VLM) は、画像の特徴とテキスト属性の間の … 続きを読む

カテゴリー: cs.AI, cs.CV | RaVL: Discovering and Mitigating Spurious Correlations in Fine-Tuned Vision-Language Models はコメントを受け付けていません