-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Enhancing Target-unspecific Tasks through a Features Matrix
要約 大規模なビジョン言語モデルの迅速な学習の最近の開発により、ターゲット固有の … 続きを読む
Breaking Annotation Barriers: Generalized Video Quality Assessment via Ranking-based Self-Supervision
要約 ビデオ品質評価(VQA)は、カメラキャプチャシステムからオーバーザトップス … 続きを読む
カテゴリー: cs.CV
Breaking Annotation Barriers: Generalized Video Quality Assessment via Ranking-based Self-Supervision はコメントを受け付けていません
PAHA: Parts-Aware Audio-Driven Human Animation with Diffusion Model
要約 オーディオ駆動型のヒューマンアニメーションテクノロジーは、ヒューマンコンピ … 続きを読む
Visual Imitation Enables Contextual Humanoid Control
要約 ヒューマノイドに階段を登り、周囲の環境のコンテキストを使用して椅子に座るよ … 続きを読む
Uncertainty-Aware Prototype Semantic Decoupling for Text-Based Person Search in Full Images
要約 完全な画像のテキストベースの歩行者検索(TBPS)は、自然言語の説明を使用 … 続きを読む
カテゴリー: cs.CV
Uncertainty-Aware Prototype Semantic Decoupling for Text-Based Person Search in Full Images はコメントを受け付けていません
Automated Data Curation Using GPS & NLP to Generate Instruction-Action Pairs for Autonomous Vehicle Vision-Language Navigation Datasets
要約 命令アクション(IA)データペアは、ロボットシステム、特に自動運転車(AV … 続きを読む
OccCylindrical: Multi-Modal Fusion with Cylindrical Representation for 3D Semantic Occupancy Prediction
要約 自動運転車(AVS)の安全な操作は、周囲の理解に大きく依存しています。 こ … 続きを読む
Robotic Visual Instruction
要約 最近、自然言語は、人間とロボットの相互作用の主要な媒体でした。 ただし、空 … 続きを読む
LiftFeat: 3D Geometry-Aware Local Feature Matching
要約 堅牢で効率的なローカル機能マッチングは、スラムやロボット工学の視覚的ローカ … 続きを読む
The Devil is in the Prompts: Retrieval-Augmented Prompt Optimization for Text-to-Video Generation
要約 大規模なデータセットで訓練されたテキストツービデオ(T2V)生成モデルの進 … 続きを読む