月別アーカイブ: 2025年3月

NuGrounding: A Multi-View 3D Visual Grounding Framework in Autonomous Driving

要約 マルチビュー3D視覚接地は、自動運転車が自然言語を解釈し、複雑な環境でター … 続きを読む

カテゴリー: cs.CV | NuGrounding: A Multi-View 3D Visual Grounding Framework in Autonomous Driving はコメントを受け付けていません

EndoLRMGS: Complete Endoscopic Scene Reconstruction combining Large Reconstruction Modelling and Gaussian Splatting

要約 手術シーンの完全な再構築は、ロボット支援手術(RAS)にとって非常に重要で … 続きを読む

カテゴリー: cs.CV | EndoLRMGS: Complete Endoscopic Scene Reconstruction combining Large Reconstruction Modelling and Gaussian Splatting はコメントを受け付けていません

DyCoke: Dynamic Compression of Tokens for Fast Video Large Language Models

要約 ビデオ大規模な言語モデル(VLLM)は、最近、複雑なビデオコンテンツの処理 … 続きを読む

カテゴリー: cs.CV, cs.LG | DyCoke: Dynamic Compression of Tokens for Fast Video Large Language Models はコメントを受け付けていません

SemAlign3D: Semantic Correspondence between RGB-Images through Aligning 3D Object-Class Representations

要約 セマンティック対応は、最近の大規模なビジョンモデル(LVM)の進歩を通じて … 続きを読む

カテゴリー: cs.CV | SemAlign3D: Semantic Correspondence between RGB-Images through Aligning 3D Object-Class Representations はコメントを受け付けていません

Rethinking Efficient and Effective Point-based Networks for Event Camera Classification and Regression: EventMamba

要約 イベントカメラは、生物学的システムからインスピレーションを引き出し、最小限 … 続きを読む

カテゴリー: cs.CV | Rethinking Efficient and Effective Point-based Networks for Event Camera Classification and Regression: EventMamba はコメントを受け付けていません

Adaptive Weighted Parameter Fusion with CLIP for Class-Incremental Learning

要約 クラスインクリメンテルラーニング(CIL)により、モデルは新しいクラスから … 続きを読む

カテゴリー: cs.CV | Adaptive Weighted Parameter Fusion with CLIP for Class-Incremental Learning はコメントを受け付けていません

Patch-Depth Fusion: Dichotomous Image Segmentation via Fine-Grained Patch Strategy and Depth Integrity-Prior

要約 二分法画像セグメンテーション(DIS)は、高解像度の自然画像の高精度オブジ … 続きを読む

カテゴリー: cs.CV | Patch-Depth Fusion: Dichotomous Image Segmentation via Fine-Grained Patch Strategy and Depth Integrity-Prior はコメントを受け付けていません

Scenario Dreamer: Vectorized Latent Diffusion for Generating Driving Simulation Environments

要約 レーングラフとエージェントの境界ボックスを含む初期トラフィックシーンと閉ル … 続きを読む

カテゴリー: cs.CV, cs.RO | Scenario Dreamer: Vectorized Latent Diffusion for Generating Driving Simulation Environments はコメントを受け付けていません

UniCon: Unidirectional Information Flow for Effective Control of Large-Scale Diffusion Models

要約 大規模拡散モデルのトレーニングアダプターの制御と効率を高めるために設計され … 続きを読む

カテゴリー: cs.CV | UniCon: Unidirectional Information Flow for Effective Control of Large-Scale Diffusion Models はコメントを受け付けていません

Masked Self-Supervised Pre-Training for Text Recognition Transformers on Large-Scale Datasets

要約 自己学習学習は、さまざまなドメインのモデルパフォーマンスを改善するために、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Masked Self-Supervised Pre-Training for Text Recognition Transformers on Large-Scale Datasets はコメントを受け付けていません