cs.CV」カテゴリーアーカイブ

Enhancing Underwater Imaging with 4-D Light Fields: Dataset and Method

要約 この論文では、光の吸収、散乱、その他の課題に悩まされる水中イメージングを強 … 続きを読む

カテゴリー: cs.CV, eess.IV | Enhancing Underwater Imaging with 4-D Light Fields: Dataset and Method はコメントを受け付けていません

DeformGS: Scene Flow in Highly Deformable Scenes for Deformable Object Manipulation

要約 布などの変形可能な物体を折りたたんだり、ドレープしたり、位置を変更したりす … 続きを読む

カテゴリー: cs.CV, cs.RO | DeformGS: Scene Flow in Highly Deformable Scenes for Deformable Object Manipulation はコメントを受け付けていません

LSMS: Language-guided Scale-aware MedSegmentor for Medical Image Referring Segmentation

要約 従来の医用画像セグメンテーション方法は、医師が診断や治療のために特定の病変 … 続きを読む

カテゴリー: cs.CV, I.4.6 | LSMS: Language-guided Scale-aware MedSegmentor for Medical Image Referring Segmentation はコメントを受け付けていません

A Permuted Autoregressive Approach to Word-Level Recognition for Urdu Digital Text

要約 この研究論文では、デジタル ウルドゥー語テキスト向けに特別に設計された新し … 続きを読む

カテゴリー: cs.AI, cs.CV | A Permuted Autoregressive Approach to Word-Level Recognition for Urdu Digital Text はコメントを受け付けていません

Look, Learn and Leverage (L$^3$): Mitigating Visual-Domain Shift and Discovering Intrinsic Relations via Symbolic Alignment

要約 最新の深層学習モデルは、視覚的な外観と本質的な関係 (因果構造など) デー … 続きを読む

カテゴリー: cs.CV | Look, Learn and Leverage (L$^3$): Mitigating Visual-Domain Shift and Discovering Intrinsic Relations via Symbolic Alignment はコメントを受け付けていません

RT-GS2: Real-Time Generalizable Semantic Segmentation for 3D Gaussian Representations of Radiance Fields

要約 ガウス スプラッティングは、リアルタイムで高いレンダリング パフォーマンス … 続きを読む

カテゴリー: cs.CV | RT-GS2: Real-Time Generalizable Semantic Segmentation for 3D Gaussian Representations of Radiance Fields はコメントを受け付けていません

How Knowledge Distillation Mitigates the Synthetic Gap in Fair Face Recognition

要約 知識蒸留 (KD) 戦略の機能を活用して、最近の顔認識データセットの撤回に … 続きを読む

カテゴリー: cs.CV | How Knowledge Distillation Mitigates the Synthetic Gap in Fair Face Recognition はコメントを受け付けていません

Generative AI Enables Medical Image Segmentation in Ultra Low-Data Regimes

要約 医療画像のセマンティック セグメンテーションは、病気の診断や治療計画などの … 続きを読む

カテゴリー: cs.CV, eess.IV | Generative AI Enables Medical Image Segmentation in Ultra Low-Data Regimes はコメントを受け付けていません

Open-vocabulary Temporal Action Localization using VLMs

要約 ビデオ アクションのローカリゼーションは、長いビデオから特定のアクションの … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Open-vocabulary Temporal Action Localization using VLMs はコメントを受け付けていません

CinePreGen: Camera Controllable Video Previsualization via Engine-powered Diffusion

要約 ビデオ生成 AI モデル (SORA など) の進歩に伴い、クリエイターは … 続きを読む

カテゴリー: cs.CV, cs.HC | CinePreGen: Camera Controllable Video Previsualization via Engine-powered Diffusion はコメントを受け付けていません