投稿者「jarxiv」のアーカイブ

Improving Sound Source Localization with Joint Slot Attention on Image and Audio

要約 サウンドソースのローカリゼーション(SSL)は、画像内の音源を見つけるタス … 続きを読む

カテゴリー: cs.CV, cs.SD | コメントする

Robust and Real-time Surface Normal Estimation from Stereo Disparities using Affine Transformations

要約 この作業では、整流されたステレオ画像ペアからの表面正常推定の新しい方法を導 … 続きを読む

カテゴリー: cs.CV | コメントする

MoBGS: Motion Deblurring Dynamic 3D Gaussian Splatting for Blurry Monocular Video

要約 私たちは、エンドツーエンドの方法でぼやけた単眼動画からのシャープで高品質の … 続きを読む

カテゴリー: cs.CV | コメントする

A General Infrastructure and Workflow for Quadrotor Deep Reinforcement Learning and Reality Deployment

要約 構造化されていない屋外環境でロボット学習方法を四輪に展開することはエキサイ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントする

GroundingSuite: Measuring Complex Multi-Granular Pixel Grounding

要約 表現セグメンテーション(RES)を参照するなどのタスクを含むピクセルの接地 … 続きを読む

カテゴリー: cs.CV | コメントする

EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models

要約 このペーパーでは、EasyEdit2を紹介します。これは、大規模な言語モデ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC, cs.LG | コメントする

Instance-Adaptive Keypoint Learning with Local-to-Global Geometric Aggregation for Category-Level Object Pose Estimation

要約 カテゴリレベルのオブジェクトのポーズ推定は、事前に定義されたカテゴリから以 … 続きを読む

カテゴリー: cs.CV | コメントする

Deep Compression Autoencoder for Efficient High-Resolution Diffusion Models

要約 高解像度の拡散モデルを加速するための自動エンコーダーモデルの新しいファミリ … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

‘I Know It When I See It’: Mood Spaces for Connecting and Expressing Visual Concepts

要約 複雑な概念を表現することは、ラベル付けまたは定量化できる場合は簡単ですが、 … 続きを読む

カテゴリー: cs.CV | コメントする

Landmark-Free Preoperative-to-Intraoperative Registration in Laparoscopic Liver Resection

要約 術前の3Dモデルを術中2Dフレームにオーバーレイすることによる肝臓登録は、 … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする