-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Revisiting Medical Image Retrieval via Knowledge Consolidation
要約 人工知能とデジタル医学がますますヘルスケアシステムに浸透するにつれて、倫理 … 続きを読む
Pig behavior dataset and Spatial-temporal perception and enhancement networks based on the attention mechanism for pig behavior recognition
要約 豚の行動の認識は、豚の賢い農業と福祉保証において重要な役割を果たします。 … 続きを読む
Close-up-GS: Enhancing Close-Up View Synthesis in 3D Gaussian Splatting with Progressive Self-Training
要約 3D Gaussian Splatting(3DGS)は、特定の視点でトレ … 続きを読む
ForAug: Recombining Foregrounds and Backgrounds to Improve Vision Transformer Training with Bias Mitigation
要約 トランス、特にビジョントランス(VITS)は、大規模な画像分類で最先端のパ … 続きを読む
Object-Centric World Model for Language-Guided Manipulation
要約 エージェントが自律運転やロボット工学などのドメインで将来を予測し、計画する … 続きを読む
Multi-Agent Image Restoration
要約 画像修復(IR)は、実際の劣化の複雑さのために困難です。 多くの専門的でオ … 続きを読む
Probabilistic Language-Image Pre-Training
要約 ビジョン言語モデル(VLM)は、アライメントされた画像テキストペアをジョイ … 続きを読む
Text-to-3D Generation by 2D Editing
要約 ゲーム、フィルム、インテリアデザイン全体の3Dクリエイティブアプリケーショ … 続きを読む
カテゴリー: cs.CV
Text-to-3D Generation by 2D Editing はコメントを受け付けていません
OpenVidVRD: Open-Vocabulary Video Visual Relation Detection via Prompt-Driven Semantic Space Alignment
要約 ビデオ視覚関係検出(VIDVRD)タスクは、動的なコンテンツ、高い注釈コス … 続きを読む
カテゴリー: cs.CV
OpenVidVRD: Open-Vocabulary Video Visual Relation Detection via Prompt-Driven Semantic Space Alignment はコメントを受け付けていません
P3P: Pseudo-3D Pre-training for Scaling 3D Masked Autoencoders
要約 3Dの事前トレーニングは、3D認識タスクを進めるために極めて重要です。 た … 続きを読む
カテゴリー: cs.CV
P3P: Pseudo-3D Pre-training for Scaling 3D Masked Autoencoders はコメントを受け付けていません