-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Local-Global Attention: An Adaptive Mechanism for Multi-Scale Feature Integration
要約 近年、アテンション メカニズムにより、主要な特徴情報に焦点を当てることによ … 続きを読む
Information-driven design of imaging systems
要約 最新の画像システムのほとんどは、人間が見る前に、または人間が見る代わりに、 … 続きを読む
カテゴリー: cs.CV, cs.IT, eess.IV, math.IT, physics.data-an, physics.optics
Information-driven design of imaging systems はコメントを受け付けていません
Vision-based Manipulation of Transparent Plastic Bags in Industrial Setups
要約 この論文では、インダストリー 4.0 パラダイムに沿って、産業環境における … 続きを読む
One-Shot Manipulation Strategy Learning by Making Contact Analogies
要約 我々は、新しいオブジェクトへの高速かつ広範な一般化を伴う操作戦略のワンショ … 続きを読む
Super-resolution multi-contrast unbiased eye atlases with deep probabilistic refinement
要約 目的: 目の形態、特に眼窩と視神経は集団によって大きく異なります。 これら … 続きを読む
I2I-Mamba: Multi-modal medical image synthesis via selective state space modeling
要約 近年、トランスフォーマーコンポーネントで構成される深層学習モデルにより、医 … 続きを読む
Advancing Fine-Grained Visual Understanding with Multi-Scale Alignment in Multi-Modal Models
要約 マルチモーダル大規模言語モデル (MLLM) は、さまざまなタスクにわたる … 続きを読む
カテゴリー: cs.CV
Advancing Fine-Grained Visual Understanding with Multi-Scale Alignment in Multi-Modal Models はコメントを受け付けていません
CropCraft: Inverse Procedural Modeling for 3D Reconstruction of Crop Plants
要約 画像から植物の 3D デジタル ツインを自動的に構築する機能は、農業、環境 … 続きを読む
カテゴリー: cs.CV
CropCraft: Inverse Procedural Modeling for 3D Reconstruction of Crop Plants はコメントを受け付けていません
On the Surprising Effectiveness of Attention Transfer for Vision Transformers
要約 従来の通念では、ビジョン トランスフォーマー (ViT) を事前トレーニン … 続きを読む
MagicQuill: An Intelligent Interactive Image Editing System
要約 画像編集にはさまざまな複雑なタスクが含まれており、効率的かつ正確な操作技術 … 続きを読む
カテゴリー: cs.CV
MagicQuill: An Intelligent Interactive Image Editing System はコメントを受け付けていません