cs.CV」カテゴリーアーカイブ

A Chinese Continuous Sign Language Dataset Based on Complex Environments

要約 継続的手話認識 (CSLR) 研究における現在のボトルネックは、公的に利用 … 続きを読む

カテゴリー: cs.CV | A Chinese Continuous Sign Language Dataset Based on Complex Environments はコメントを受け付けていません

Unveiling the Black Box: Independent Functional Module Evaluation for Bird’s-Eye-View Perception Model

要約 エンドツーエンドのモデルが自動運転認識の主流として台頭しつつあります。 し … 続きを読む

カテゴリー: cs.CV | Unveiling the Black Box: Independent Functional Module Evaluation for Bird’s-Eye-View Perception Model はコメントを受け付けていません

MitoSeg: Mitochondria Segmentation Tool

要約 最近の研究では、ミトコンドリアの物理的構造と神経変性疾患との潜在的な関連性 … 続きを読む

カテゴリー: cs.CV | MitoSeg: Mitochondria Segmentation Tool はコメントを受け付けていません

OneEncoder: A Lightweight Framework for Progressive Alignment of Modalities

要約 クロスモーダル調整学習では、テキスト、画像、音声、ビデオなどのさまざまなモ … 続きを読む

カテゴリー: cs.CV, cs.LG | OneEncoder: A Lightweight Framework for Progressive Alignment of Modalities はコメントを受け付けていません

Intraoperative Registration by Cross-Modal Inverse Neural Rendering

要約 この論文では、クロスモーダル逆ニューラル レンダリングを介した脳神経外科手 … 続きを読む

カテゴリー: cs.CV | Intraoperative Registration by Cross-Modal Inverse Neural Rendering はコメントを受け付けていません

PFDiff: Training-free Acceleration of Diffusion Models through the Gradient Guidance of Past and Future

要約 拡散確率モデル (DPM) は画像生成において顕著な可能性を示していますが … 続きを読む

カテゴリー: cs.CV | PFDiff: Training-free Acceleration of Diffusion Models through the Gradient Guidance of Past and Future はコメントを受け付けていません

Inverse Problems with Diffusion Models: A MAP Estimation Perspective

要約 逆問題は科学や工学で多くの用途があります。 コンピューター ビジョンでは、 … 続きを読む

カテゴリー: cs.CV, cs.LG | Inverse Problems with Diffusion Models: A MAP Estimation Perspective はコメントを受け付けていません

Continual Learning: Forget-free Winning Subnetworks for Video Representations

要約 大規模で高密度のネットワーク内に効率的なサブネットワークが存在することを強 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Continual Learning: Forget-free Winning Subnetworks for Video Representations はコメントを受け付けていません

Towards Global Localization using Multi-Modal Object-Instance Re-Identification

要約 再識別 (ReID) はコンピュータ ビジョンにおける重要な課題であり、主 … 続きを読む

カテゴリー: 68T40, cs.CV, cs.RO, I.2.10 | Towards Global Localization using Multi-Modal Object-Instance Re-Identification はコメントを受け付けていません

Panoptic-Depth Forecasting

要約 シーンのセマンティクスと 3D 構造を予測することは、ロボットが安全に移動 … 続きを読む

カテゴリー: cs.CV, cs.RO | Panoptic-Depth Forecasting はコメントを受け付けていません