-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年5月
PoseCrafter: One-Shot Personalized Video Synthesis Following Flexible Pose Control
要約 このペーパーでは、柔軟なポーズの制御に続いてパーソナライズされたビデオを生 … 続きを読む
Rethinking CLIP-based Video Learners in Cross-Domain Open-Vocabulary Action Recognition
要約 CLIP (対照的言語イメージ事前トレーニング) の目覚ましい成功に基づい … 続きを読む
カテゴリー: cs.CV
Rethinking CLIP-based Video Learners in Cross-Domain Open-Vocabulary Action Recognition はコメントを受け付けていません
Beyond Literal Descriptions: Understanding and Locating Open-World Objects Aligned with Human Intentions
要約 ビジュアル グラウンディング (VG) は、指定された自然言語表現に一致す … 続きを読む
カテゴリー: cs.CV
Beyond Literal Descriptions: Understanding and Locating Open-World Objects Aligned with Human Intentions はコメントを受け付けていません
Domain Generalisation for Object Detection under Covariate and Concept Shift
要約 ドメイン一般化は、ドメイン固有の特徴を抑制しながら、ドメイン不変の特徴の学 … 続きを読む
カテゴリー: cs.CV
Domain Generalisation for Object Detection under Covariate and Concept Shift はコメントを受け付けていません
Automatic Data Curation for Self-Supervised Learning: A Clustering-Based Approach
要約 自己教師あり機能は、最新の機械学習システムの基礎です。 通常、データ収集に … 続きを読む
DiffCalib: Reformulating Monocular Camera Calibration as Diffusion-Based Dense Incident Map Generation
要約 単眼カメラのキャリブレーションは、多くの 3D ビジョン アプリケーション … 続きを読む
カテゴリー: cs.CV
DiffCalib: Reformulating Monocular Camera Calibration as Diffusion-Based Dense Incident Map Generation はコメントを受け付けていません
Align as Ideal: Cross-Modal Alignment Binding for Federated Medical Vision-Language Pre-training
要約 ビジョン言語事前トレーニング (VLP) は、マルチモーダル表現学習の効率 … 続きを読む
LAM3D: Large Image-Point-Cloud Alignment Model for 3D Reconstruction from Single Image
要約 大規模再構成モデルは、単一または複数の入力画像からの自動 3D コンテ … 続きを読む
カテゴリー: cs.CV
LAM3D: Large Image-Point-Cloud Alignment Model for 3D Reconstruction from Single Image はコメントを受け付けていません
Less is more: Summarizing Patch Tokens for efficient Multi-Label Class-Incremental Learning
要約 プロンプト チューニングは、タスク固有のパラメータ (またはプロンプト) … 続きを読む