-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2023年9月
Class Incremental Learning via Likelihood Ratio Based Task Prediction
要約 クラス増分学習 (CIL) は、一連のタスクを順番に学習する、継続的な学習 … 続きを読む
Language-EXtended Indoor SLAM (LEXIS): A Versatile System for Real-time Visual Scene Understanding
要約 多用途かつ適応的な意味理解により、自律システムが周囲の環境を理解し、相互作 … 続きを読む
RPEFlow: Multimodal Fusion of RGB-PointCloud-Event for Joint Optical Flow and Scene Flow Estimation
要約 最近、2D オプティカル フローと 3D シーン フローを共同推定するため … 続きを読む
カテゴリー: cs.CV
RPEFlow: Multimodal Fusion of RGB-PointCloud-Event for Joint Optical Flow and Scene Flow Estimation はコメントを受け付けていません
The Surveillance AI Pipeline
要約 AI研究、特にコンピュータビジョンが大量監視と密接に結びついていると主張す … 続きを読む
Video-adverb retrieval with compositional adverb-action embeddings
要約 ビデオ内のアクションを説明する副詞を取得することは、ビデオを詳細に理解する … 続きを読む
カテゴリー: cs.CV
Video-adverb retrieval with compositional adverb-action embeddings はコメントを受け付けていません
VideoDirectorGPT: Consistent Multi-scene Video Generation via LLM-Guided Planning
要約 最近のテキストからビデオへの (T2V) 生成方法は大幅な進歩を遂げていま … 続きを読む
Case Study: Ensemble Decision-Based Annotation of Unconstrained Real Estate Images
要約 シンプルな反復ルールベースの半教師あり学習を使用して、不動産画像に注釈を付 … 続きを読む
Binarized Spectral Compressive Imaging
要約 ハイパースペクトル画像 (HSI) 再構成用の既存の深層学習モデルは優れた … 続きを読む
LAVIE: High-Quality Video Generation with Cascaded Latent Diffusion Models
要約 この研究は、事前トレーニングされたテキストから画像への (T2I) モデル … 続きを読む
カテゴリー: cs.CV
LAVIE: High-Quality Video Generation with Cascaded Latent Diffusion Models はコメントを受け付けていません
DistillBEV: Boosting Multi-Camera 3D Object Detection with Cross-Modal Knowledge Distillation
要約 カメラは自動運転業界での大量生産に費用対効果が高いため、マルチカメラの鳥瞰 … 続きを読む