月別アーカイブ: 2025年4月

STI-Bench: Are MLLMs Ready for Precise Spatial-Temporal World Understanding?

要約 具体化されたAIおよび自律運転のためのエンドツーエンドのソリューションとし … 続きを読む

カテゴリー: cs.CV | コメントする

A triple-branch network for latent fingerprint enhancement guided by orientation fields and minutiae

要約 潜在指紋の強化は、潜在的な指紋識別のプロセスにおける重要なステップです。 … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

Unwarping Screen Content Images via Structure-texture Enhancement Network and Transformation Self-estimation

要約 既存の暗黙的なニューラルネットワークベースの画像の巻き上げメソッドは、自然 … 続きを読む

カテゴリー: cs.CV | コメントする

Improving Sound Source Localization with Joint Slot Attention on Image and Audio

要約 サウンドソースのローカリゼーション(SSL)は、画像内の音源を見つけるタス … 続きを読む

カテゴリー: cs.CV, cs.SD | コメントする

Robust and Real-time Surface Normal Estimation from Stereo Disparities using Affine Transformations

要約 この作業では、整流されたステレオ画像ペアからの表面正常推定の新しい方法を導 … 続きを読む

カテゴリー: cs.CV | コメントする

MoBGS: Motion Deblurring Dynamic 3D Gaussian Splatting for Blurry Monocular Video

要約 私たちは、エンドツーエンドの方法でぼやけた単眼動画からのシャープで高品質の … 続きを読む

カテゴリー: cs.CV | コメントする

A General Infrastructure and Workflow for Quadrotor Deep Reinforcement Learning and Reality Deployment

要約 構造化されていない屋外環境でロボット学習方法を四輪に展開することはエキサイ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントする

GroundingSuite: Measuring Complex Multi-Granular Pixel Grounding

要約 表現セグメンテーション(RES)を参照するなどのタスクを含むピクセルの接地 … 続きを読む

カテゴリー: cs.CV | コメントする

EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models

要約 このペーパーでは、EasyEdit2を紹介します。これは、大規模な言語モデ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC, cs.LG | コメントする

Instance-Adaptive Keypoint Learning with Local-to-Global Geometric Aggregation for Category-Level Object Pose Estimation

要約 カテゴリレベルのオブジェクトのポーズ推定は、事前に定義されたカテゴリから以 … 続きを読む

カテゴリー: cs.CV | コメントする