月別アーカイブ: 2024年9月

Tracking Any Point with Frame-Event Fusion Network at High Frame Rate

投稿日: 2024年9月19日作成者: jarxiv

要約画像フレームに基づく任意のポイントの追跡はフレームレートによって制限され … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

A Chinese Continuous Sign Language Dataset Based on Complex Environments

投稿日: 2024年9月19日作成者: jarxiv

要約継続的手話認識 (CSLR) 研究における現在のボトルネックは、公的に利用 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Unveiling the Black Box: Independent Functional Module Evaluation for Bird’s-Eye-View Perception Model

投稿日: 2024年9月19日作成者: jarxiv

要約エンドツーエンドのモデルが自動運転認識の主流として台頭しつつあります。し … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

MitoSeg: Mitochondria Segmentation Tool

投稿日: 2024年9月19日作成者: jarxiv

要約最近の研究では、ミトコンドリアの物理的構造と神経変性疾患との潜在的な関連性 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

OneEncoder: A Lightweight Framework for Progressive Alignment of Modalities

投稿日: 2024年9月19日作成者: jarxiv

要約クロスモーダル調整学習では、テキスト、画像、音声、ビデオなどのさまざまなモ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Intraoperative Registration by Cross-Modal Inverse Neural Rendering

投稿日: 2024年9月19日作成者: jarxiv

要約この論文では、クロスモーダル逆ニューラルレンダリングを介した脳神経外科手 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

PFDiff: Training-free Acceleration of Diffusion Models through the Gradient Guidance of Past and Future

投稿日: 2024年9月19日作成者: jarxiv

要約拡散確率モデル (DPM) は画像生成において顕著な可能性を示していますが … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Inverse Problems with Diffusion Models: A MAP Estimation Perspective

投稿日: 2024年9月19日作成者: jarxiv

要約逆問題は科学や工学で多くの用途があります。コンピュータービジョンでは、 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Continual Learning: Forget-free Winning Subnetworks for Video Representations

投稿日: 2024年9月19日作成者: jarxiv

要約大規模で高密度のネットワーク内に効率的なサブネットワークが存在することを強 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Towards Global Localization using Multi-Modal Object-Instance Re-Identification

投稿日: 2024年9月19日作成者: jarxiv

要約再識別 (ReID) はコンピュータビジョンにおける重要な課題であり、主 … 続きを読む →

カテゴリー: 68T40, cs.CV, cs.RO, I.2.10 | コメントを受け付けていません

月別アーカイブ: 2024年9月

Tracking Any Point with Frame-Event Fusion Network at High Frame Rate

A Chinese Continuous Sign Language Dataset Based on Complex Environments

Unveiling the Black Box: Independent Functional Module Evaluation for Bird’s-Eye-View Perception Model

MitoSeg: Mitochondria Segmentation Tool

OneEncoder: A Lightweight Framework for Progressive Alignment of Modalities

Intraoperative Registration by Cross-Modal Inverse Neural Rendering

PFDiff: Training-free Acceleration of Diffusion Models through the Gradient Guidance of Past and Future

Inverse Problems with Diffusion Models: A MAP Estimation Perspective

Continual Learning: Forget-free Winning Subnetworks for Video Representations

Towards Global Localization using Multi-Modal Object-Instance Re-Identification

最近の投稿

最近のコメント

アーカイブ

カテゴリー