月別アーカイブ: 2024年4月

Combating Missing Modalities in Egocentric Videos at Test Time

要約 複数のモダリティを含むビデオを理解することは、特に自己中心的なビデオの場合 … 続きを読む

カテゴリー: cs.CV | Combating Missing Modalities in Egocentric Videos at Test Time はコメントを受け付けていません

Adaptive Mixed-Scale Feature Fusion Network for Blind AI-Generated Image Quality Assessment

要約 テキストから画像への生成モデルおよび画像から画像への生成モデルの成熟度が高 … 続きを読む

カテゴリー: cs.CV, eess.IV | Adaptive Mixed-Scale Feature Fusion Network for Blind AI-Generated Image Quality Assessment はコメントを受け付けていません

Fourier-enhanced Implicit Neural Fusion Network for Multispectral and Hyperspectral Image Fusion

要約 最近、暗黙的ニューラル表現 (INR) はさまざまな視覚関連ドメインで大き … 続きを読む

カテゴリー: cs.CV | Fourier-enhanced Implicit Neural Fusion Network for Multispectral and Hyperspectral Image Fusion はコメントを受け付けていません

Closed Loop Interactive Embodied Reasoning for Robot Manipulation

要約 身体的推論システムは、ロボット ハードウェアと認知プロセスを統合し、通常、 … 続きを読む

カテゴリー: cs.CV, cs.RO | Closed Loop Interactive Embodied Reasoning for Robot Manipulation はコメントを受け付けていません

Deep Models for Multi-View 3D Object Recognition: A Review

要約 人間の意思決定は、多くの場合、複数の視点や視点からの視覚情報に依存します。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Deep Models for Multi-View 3D Object Recognition: A Review はコメントを受け付けていません

Re-Thinking Inverse Graphics With Large Language Models

要約 逆グラフィックス (画像を物理変数に反転し、レンダリング時に観察されたシー … 続きを読む

カテゴリー: cs.CL, cs.CV | Re-Thinking Inverse Graphics With Large Language Models はコメントを受け付けていません

Massively Annotated Datasets for Assessment of Synthetic and Real Data in Face Recognition

要約 顔認識アプリケーションは、データセットのサイズ、深層学習モデルの複雑さ、計 … 続きを読む

カテゴリー: cs.CV | Massively Annotated Datasets for Assessment of Synthetic and Real Data in Face Recognition はコメントを受け付けていません

Efficient Transformer Encoders for Mask2Former-style models

要約 ビジョン トランスフォーマー ベースのモデルは、画像セグメンテーション タ … 続きを読む

カテゴリー: cs.CV, cs.LG | Efficient Transformer Encoders for Mask2Former-style models はコメントを受け付けていません

Source-free Domain Adaptation for Video Object Detection Under Adverse Image Conditions

要約 事前トレーニングされたビデオ オブジェクト検出器を現実世界のシナリオに導入 … 続きを読む

カテゴリー: cs.CV | Source-free Domain Adaptation for Video Object Detection Under Adverse Image Conditions はコメントを受け付けていません

UniMERNet: A Universal Network for Real-World Mathematical Expression Recognition

要約 この論文では、複雑な現実世界のシナリオに向けた数式認識 (MER) に関す … 続きを読む

カテゴリー: cs.CV | UniMERNet: A Universal Network for Real-World Mathematical Expression Recognition はコメントを受け付けていません