月別アーカイブ: 2023年9月

Class Incremental Learning via Likelihood Ratio Based Task Prediction

要約 クラス増分学習 (CIL) は、一連のタスクを順番に学習する、継続的な学習 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Class Incremental Learning via Likelihood Ratio Based Task Prediction はコメントを受け付けていません

Language-EXtended Indoor SLAM (LEXIS): A Versatile System for Real-time Visual Scene Understanding

要約 多用途かつ適応的な意味理解により、自律システムが周囲の環境を理解し、相互作 … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | Language-EXtended Indoor SLAM (LEXIS): A Versatile System for Real-time Visual Scene Understanding はコメントを受け付けていません

RPEFlow: Multimodal Fusion of RGB-PointCloud-Event for Joint Optical Flow and Scene Flow Estimation

要約 最近、2D オプティカル フローと 3D シーン フローを共同推定するため … 続きを読む

カテゴリー: cs.CV | RPEFlow: Multimodal Fusion of RGB-PointCloud-Event for Joint Optical Flow and Scene Flow Estimation はコメントを受け付けていません

The Surveillance AI Pipeline

要約 AI研究、特にコンピュータビジョンが大量監視と密接に結びついていると主張す … 続きを読む

カテゴリー: cs.CV, cs.CY | The Surveillance AI Pipeline はコメントを受け付けていません

Video-adverb retrieval with compositional adverb-action embeddings

要約 ビデオ内のアクションを説明する副詞を取得することは、ビデオを詳細に理解する … 続きを読む

カテゴリー: cs.CV | Video-adverb retrieval with compositional adverb-action embeddings はコメントを受け付けていません

VideoDirectorGPT: Consistent Multi-scene Video Generation via LLM-Guided Planning

要約 最近のテキストからビデオへの (T2V) 生成方法は大幅な進歩を遂げていま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | VideoDirectorGPT: Consistent Multi-scene Video Generation via LLM-Guided Planning はコメントを受け付けていません

Case Study: Ensemble Decision-Based Annotation of Unconstrained Real Estate Images

要約 シンプルな反復ルールベースの半教師あり学習を使用して、不動産画像に注釈を付 … 続きを読む

カテゴリー: 68, cs.CV, I.4.8 | Case Study: Ensemble Decision-Based Annotation of Unconstrained Real Estate Images はコメントを受け付けていません

Binarized Spectral Compressive Imaging

要約 ハイパースペクトル画像 (HSI) 再構成用の既存の深層学習モデルは優れた … 続きを読む

カテゴリー: cs.CV, eess.IV | Binarized Spectral Compressive Imaging はコメントを受け付けていません

LAVIE: High-Quality Video Generation with Cascaded Latent Diffusion Models

要約 この研究は、事前トレーニングされたテキストから画像への (T2I) モデル … 続きを読む

カテゴリー: cs.CV | LAVIE: High-Quality Video Generation with Cascaded Latent Diffusion Models はコメントを受け付けていません

DistillBEV: Boosting Multi-Camera 3D Object Detection with Cross-Modal Knowledge Distillation

要約 カメラは自動運転業界での大量生産に費用対効果が高いため、マルチカメラの鳥瞰 … 続きを読む

カテゴリー: cs.CV, cs.RO | DistillBEV: Boosting Multi-Camera 3D Object Detection with Cross-Modal Knowledge Distillation はコメントを受け付けていません