-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Weighted Ensemble Models Are Strong Continual Learners
要約 この研究では、継続学習 (CL) の問題を研究します。目標は、現在のタスク … 続きを読む
Orchestrating the Symphony of Prompt Distribution Learning for Human-Object Interaction Detection
要約 一般的なクエリ トランスフォーマ アーキテクチャを備えたヒューマン オブジ … 続きを読む
カテゴリー: cs.CV
Orchestrating the Symphony of Prompt Distribution Learning for Human-Object Interaction Detection はコメントを受け付けていません
Recoverable Compression: A Multimodal Vision Token Recovery Mechanism Guided by Text Information
要約 大規模言語モデリング技術の進歩に伴い、ビジュアル エンコーダと大規模言語モ … 続きを読む
カテゴリー: cs.CV
Recoverable Compression: A Multimodal Vision Token Recovery Mechanism Guided by Text Information はコメントを受け付けていません
Combining Neural Fields and Deformation Models for Non-Rigid 3D Motion Reconstruction from Partial Data
要約 我々は、非剛体変形形状の構造化されていない可能性のある部分的な観察から、時 … 続きを読む
カテゴリー: cs.CV
Combining Neural Fields and Deformation Models for Non-Rigid 3D Motion Reconstruction from Partial Data はコメントを受け付けていません
INRetouch: Context Aware Implicit Neural Representation for Photography Retouching
要約 プロの写真編集は依然として困難であり、イメージング パイプラインに関する広 … 続きを読む
Open-Canopy: Towards Very High Resolution Forest Monitoring
要約 衛星画像から樹冠の高さとその変化をメートル解像度で推定することは、重要な環 … 続きを読む
Learning to Decouple the Lights for 3D Face Texture Modeling
要約 既存の研究は、顔が明るく照らされ、外部オクルージョンが最小限に抑えられた画 … 続きを読む
カテゴリー: cs.CV
Learning to Decouple the Lights for 3D Face Texture Modeling はコメントを受け付けていません
SenCLIP: Enhancing zero-shot land-use mapping for Sentinel-2 with ground-level prompting
要約 CLIP などの事前トレーニング済みビジョン言語モデル (VLM) は、自 … 続きを読む
カテゴリー: cs.CV
SenCLIP: Enhancing zero-shot land-use mapping for Sentinel-2 with ground-level prompting はコメントを受け付けていません
Estimating the Number of HTTP/3 Responses in QUIC Using Deep Learning
要約 QUIC は、ますます使用されている新しいトランスポート プロトコルであり … 続きを読む
Improving Satellite Imagery Masking using Multi-task and Transfer Learning
要約 多くのリモート センシング アプリケーションでは、後続の測定のために衛星画 … 続きを読む
カテゴリー: cs.CV
Improving Satellite Imagery Masking using Multi-task and Transfer Learning はコメントを受け付けていません