投稿者「jarxiv」のアーカイブ

Unwarping Screen Content Images via Structure-texture Enhancement Network and Transformation Self-estimation

要約 既存の暗黙的なニューラルネットワークベースの画像の巻き上げメソッドは、自然 … 続きを読む

カテゴリー: cs.CV | Unwarping Screen Content Images via Structure-texture Enhancement Network and Transformation Self-estimation はコメントを受け付けていません

Improving Sound Source Localization with Joint Slot Attention on Image and Audio

要約 サウンドソースのローカリゼーション(SSL)は、画像内の音源を見つけるタス … 続きを読む

カテゴリー: cs.CV, cs.SD | Improving Sound Source Localization with Joint Slot Attention on Image and Audio はコメントを受け付けていません

Robust and Real-time Surface Normal Estimation from Stereo Disparities using Affine Transformations

要約 この作業では、整流されたステレオ画像ペアからの表面正常推定の新しい方法を導 … 続きを読む

カテゴリー: cs.CV | Robust and Real-time Surface Normal Estimation from Stereo Disparities using Affine Transformations はコメントを受け付けていません

MoBGS: Motion Deblurring Dynamic 3D Gaussian Splatting for Blurry Monocular Video

要約 私たちは、エンドツーエンドの方法でぼやけた単眼動画からのシャープで高品質の … 続きを読む

カテゴリー: cs.CV | MoBGS: Motion Deblurring Dynamic 3D Gaussian Splatting for Blurry Monocular Video はコメントを受け付けていません

A General Infrastructure and Workflow for Quadrotor Deep Reinforcement Learning and Reality Deployment

要約 構造化されていない屋外環境でロボット学習方法を四輪に展開することはエキサイ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | A General Infrastructure and Workflow for Quadrotor Deep Reinforcement Learning and Reality Deployment はコメントを受け付けていません

GroundingSuite: Measuring Complex Multi-Granular Pixel Grounding

要約 表現セグメンテーション(RES)を参照するなどのタスクを含むピクセルの接地 … 続きを読む

カテゴリー: cs.CV | GroundingSuite: Measuring Complex Multi-Granular Pixel Grounding はコメントを受け付けていません

EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models

要約 このペーパーでは、EasyEdit2を紹介します。これは、大規模な言語モデ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC, cs.LG | EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models はコメントを受け付けていません

Instance-Adaptive Keypoint Learning with Local-to-Global Geometric Aggregation for Category-Level Object Pose Estimation

要約 カテゴリレベルのオブジェクトのポーズ推定は、事前に定義されたカテゴリから以 … 続きを読む

カテゴリー: cs.CV | Instance-Adaptive Keypoint Learning with Local-to-Global Geometric Aggregation for Category-Level Object Pose Estimation はコメントを受け付けていません

Deep Compression Autoencoder for Efficient High-Resolution Diffusion Models

要約 高解像度の拡散モデルを加速するための自動エンコーダーモデルの新しいファミリ … 続きを読む

カテゴリー: cs.AI, cs.CV | Deep Compression Autoencoder for Efficient High-Resolution Diffusion Models はコメントを受け付けていません

‘I Know It When I See It’: Mood Spaces for Connecting and Expressing Visual Concepts

要約 複雑な概念を表現することは、ラベル付けまたは定量化できる場合は簡単ですが、 … 続きを読む

カテゴリー: cs.CV | ‘I Know It When I See It’: Mood Spaces for Connecting and Expressing Visual Concepts はコメントを受け付けていません