-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2023年5月
POEM: Polarization of Embeddings for Domain-Invariant Representations
要約 配布外のサンプルの処理は、ディープ ビジュアル モデルにとって長期にわたる … 続きを読む
AudioToken: Adaptation of Text-Conditioned Diffusion Models for Audio-to-Image Generation
要約 近年、画像生成のパフォーマンスは大幅に向上しており、拡散モデルが中心的な役 … 続きを読む
Learning Pedestrian Actions to Ensure Safe Autonomous Driving
要約 車両と歩行者の相互作用が複雑な都市環境で安全な自動運転を確保するには、自動 … 続きを読む
Parallelizing Optical Flow Estimation on an Ultra-Low Power RISC-V Cluster for Nano-UAV Navigation
要約 オプティカル フロー推定は、無人航空機 (UAV) の自律ナビゲーションと … 続きを読む
Navya3DSeg — Navya 3D Semantic Segmentation Dataset & split generation for autonomous vehicles
要約 現在、自動運転 (AD) の認識は、大規模なアノテーション付きデータセット … 続きを読む
ControlVideo: Training-free Controllable Text-to-Video Generation
要約 テキスト駆動の拡散モデルは、画像生成において前例のない能力を解放しましたが … 続きを読む
カテゴリー: cs.CV
ControlVideo: Training-free Controllable Text-to-Video Generation はコメントを受け付けていません
Restore Anything Pipeline: Segment Anything Meets Image Restoration
要約 最近の画像復元手法は、深層学習を使用して大幅な進歩を遂げています。 しかし … 続きを読む
Open-world Semi-supervised Novel Class Discovery
要約 従来の半教師あり学習タスクは、ラベル付きデータとラベルなしデータの両方が同 … 続きを読む
GSURE-Based Diffusion Model Training with Corrupted Data
要約 拡散モデルは、データ生成と、逆問題、テキストベースの編集、分類などの下流タ … 続きを読む
VLAB: Enhancing Video Language Pre-training by Feature Adapting and Blending
要約 CLIP などの大規模な画像とテキストの対照的な事前トレーニング モデルは … 続きを読む
カテゴリー: cs.CV
VLAB: Enhancing Video Language Pre-training by Feature Adapting and Blending はコメントを受け付けていません