月別アーカイブ: 2024年2月

Improved Scene Landmark Detection for Camera Localization

要約 検索、局所特徴マッチング、および 3D 構造ベースの姿勢推定に基づくカメラ … 続きを読む

カテゴリー: cs.CV, cs.RO | Improved Scene Landmark Detection for Camera Localization はコメントを受け付けていません

Binding Touch to Everything: Learning Unified Multimodal Tactile Representations

要約 タッチを他のモダリティと関連付けられる機能は、人間とコンピューター システ … 続きを読む

カテゴリー: cs.CV, cs.RO | Binding Touch to Everything: Learning Unified Multimodal Tactile Representations はコメントを受け付けていません

Motion Guidance: Diffusion-Based Image Editing with Differentiable Motion Estimators

要約 拡散モデルは、テキストの説明に基づいて印象的な画像を生成することができ、こ … 続きを読む

カテゴリー: cs.CV | Motion Guidance: Diffusion-Based Image Editing with Differentiable Motion Estimators はコメントを受け付けていません

BlockFusion: Expandable 3D Scene Generation using Latent Tri-plane Extrapolation

要約 BlockFusion は、3D シーンを単位ブロックとして生成し、新しい … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | BlockFusion: Expandable 3D Scene Generation using Latent Tri-plane Extrapolation はコメントを受け付けていません

Graph Neural Networks with polynomial activations have limited expressivity

要約 グラフ ニューラル ネットワーク (GNN) の表現力は、1 次ロジックの … 続きを読む

カテゴリー: cs.LG | Graph Neural Networks with polynomial activations have limited expressivity はコメントを受け付けていません

Dual Relation Alignment for Composed Image Retrieval

要約 合成画像検索は、参照画像と補足テキストをクエリとして対象画像を検索するタス … 続きを読む

カテゴリー: cs.AI, cs.CV | Dual Relation Alignment for Composed Image Retrieval はコメントを受け付けていません

GazeGPT: Augmenting Human Capabilities using Gaze-contingent Contextual AI for Smart Eyewear

要約 マルチモーダル大規模言語モデル (LMM) は、世界の知識と問題解決能力に … 続きを読む

カテゴリー: cs.CV, cs.HC | GazeGPT: Augmenting Human Capabilities using Gaze-contingent Contextual AI for Smart Eyewear はコメントを受け付けていません