cs.CV」カテゴリーアーカイブ

Local-Global Attention: An Adaptive Mechanism for Multi-Scale Feature Integration

要約 近年、アテンション メカニズムにより、主要な特徴情報に焦点を当てることによ … 続きを読む

カテゴリー: cs.AI, cs.CV | Local-Global Attention: An Adaptive Mechanism for Multi-Scale Feature Integration はコメントを受け付けていません

Information-driven design of imaging systems

要約 最新の画像システムのほとんどは、人間が見る前に、または人間が見る代わりに、 … 続きを読む

カテゴリー: cs.CV, cs.IT, eess.IV, math.IT, physics.data-an, physics.optics | Information-driven design of imaging systems はコメントを受け付けていません

Vision-based Manipulation of Transparent Plastic Bags in Industrial Setups

要約 この論文では、インダストリー 4.0 パラダイムに沿って、産業環境における … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Vision-based Manipulation of Transparent Plastic Bags in Industrial Setups はコメントを受け付けていません

One-Shot Manipulation Strategy Learning by Making Contact Analogies

要約 我々は、新しいオブジェクトへの高速かつ広範な一般化を伴う操作戦略のワンショ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | One-Shot Manipulation Strategy Learning by Making Contact Analogies はコメントを受け付けていません

Super-resolution multi-contrast unbiased eye atlases with deep probabilistic refinement

要約 目的: 目の形態、特に眼窩と視神経は集団によって大きく異なります。 これら … 続きを読む

カテゴリー: cs.CV, eess.IV | Super-resolution multi-contrast unbiased eye atlases with deep probabilistic refinement はコメントを受け付けていません

I2I-Mamba: Multi-modal medical image synthesis via selective state space modeling

要約 近年、トランスフォーマーコンポーネントで構成される深層学習モデルにより、医 … 続きを読む

カテゴリー: cs.CV, eess.IV | I2I-Mamba: Multi-modal medical image synthesis via selective state space modeling はコメントを受け付けていません

Advancing Fine-Grained Visual Understanding with Multi-Scale Alignment in Multi-Modal Models

要約 マルチモーダル大規模言語モデル (MLLM) は、さまざまなタスクにわたる … 続きを読む

カテゴリー: cs.CV | Advancing Fine-Grained Visual Understanding with Multi-Scale Alignment in Multi-Modal Models はコメントを受け付けていません

CropCraft: Inverse Procedural Modeling for 3D Reconstruction of Crop Plants

要約 画像から植物の 3D デジタル ツインを自動的に構築する機能は、農業、環境 … 続きを読む

カテゴリー: cs.CV | CropCraft: Inverse Procedural Modeling for 3D Reconstruction of Crop Plants はコメントを受け付けていません

On the Surprising Effectiveness of Attention Transfer for Vision Transformers

要約 従来の通念では、ビジョン トランスフォーマー (ViT) を事前トレーニン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.NE | On the Surprising Effectiveness of Attention Transfer for Vision Transformers はコメントを受け付けていません

MagicQuill: An Intelligent Interactive Image Editing System

要約 画像編集にはさまざまな複雑なタスクが含まれており、効率的かつ正確な操作技術 … 続きを読む

カテゴリー: cs.CV | MagicQuill: An Intelligent Interactive Image Editing System はコメントを受け付けていません