月別アーカイブ: 2024年1月

Improving Continuous Sign Language Recognition with Consistency Constraints and Signer Removal

要約 ほとんどの深層学習ベースの連続手話認識 (CSLR) モデルは、視覚モジュ … 続きを読む

カテゴリー: cs.CV | Improving Continuous Sign Language Recognition with Consistency Constraints and Signer Removal はコメントを受け付けていません

MS23D: : A 3D Object Detection Method Using Multi-Scale Semantic Feature Points to Construct 3D Feature Layer

要約 LiDAR 点群は、3 次元空間内のオブジェクトの動きと姿勢を効果的に描写 … 続きを読む

カテゴリー: cs.CV | MS23D: : A 3D Object Detection Method Using Multi-Scale Semantic Feature Points to Construct 3D Feature Layer はコメントを受け付けていません

An attempt to generate new bridge types from latent space of PixelCNN

要約 生成人工知能テクノロジーを使用して、新しい種類の橋を生成してみます。 Py … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | An attempt to generate new bridge types from latent space of PixelCNN はコメントを受け付けていません

Interaction Region Visual Transformer for Egocentric Action Anticipation

要約 人間とオブジェクトのインタラクションは最も重要な視覚的手がかりの 1 つで … 続きを読む

カテゴリー: cs.CV | Interaction Region Visual Transformer for Egocentric Action Anticipation はコメントを受け付けていません

A Lightweight Feature Fusion Architecture For Resource-Constrained Crowd Counting

要約 群衆カウントは現実世界の状況に直接応用できるため、計算効率とパフォーマンス … 続きを読む

カテゴリー: cs.CV | A Lightweight Feature Fusion Architecture For Resource-Constrained Crowd Counting はコメントを受け付けていません

UAVD4L: A Large-Scale Dataset for UAV 6-DoF Localization

要約 GPS が拒否された環境における無人航空機 (UAV) の世界的な位置特定 … 続きを読む

カテゴリー: cs.CV | UAVD4L: A Large-Scale Dataset for UAV 6-DoF Localization はコメントを受け付けていません

MGARD: A multigrid framework for high-performance, error-controlled data compression and refactoring

要約 構造化グリッドおよび非構造化グリッド上の浮動小数点科学データに Multi … 続きを読む

カテゴリー: cs.CV, cs.NA, math.NA | MGARD: A multigrid framework for high-performance, error-controlled data compression and refactoring はコメントを受け付けていません

Body-Area Capacitive or Electric Field Sensing for Human Activity Recognition and Human-Computer Interaction: A Comprehensive Survey

要約 人体の約 60% が本質的に水で構成されているという事実により、人体は本質 … 続きを読む

カテゴリー: cs.CV, eess.SP | Body-Area Capacitive or Electric Field Sensing for Human Activity Recognition and Human-Computer Interaction: A Comprehensive Survey はコメントを受け付けていません

TRIPS: Trilinear Point Splatting for Real-Time Radiance Field Rendering

要約 ポイントベースの放射輝度フィールド レンダリングは、新しいビュー合成におい … 続きを読む

カテゴリー: cs.CV, cs.GR, I.3 | TRIPS: Trilinear Point Splatting for Real-Time Radiance Field Rendering はコメントを受け付けていません

How does the primate brain combine generative and discriminative computations in vision?

要約 ビジョンは推論問題として広く理解されています。 しかし、推論プロセスの 2 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, q-bio.NC | How does the primate brain combine generative and discriminative computations in vision? はコメントを受け付けていません