月別アーカイブ: 2023年9月

Class Incremental Learning via Likelihood Ratio Based Task Prediction

投稿日: 2023年9月27日作成者: jarxiv

要約クラス増分学習 (CIL) は、一連のタスクを順番に学習する、継続的な学習 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Language-EXtended Indoor SLAM (LEXIS): A Versatile System for Real-time Visual Scene Understanding

投稿日: 2023年9月27日作成者: jarxiv

要約多用途かつ適応的な意味理解により、自律システムが周囲の環境を理解し、相互作 … 続きを読む →

カテゴリー: cs.CV, cs.RO, eess.IV | コメントを受け付けていません

RPEFlow: Multimodal Fusion of RGB-PointCloud-Event for Joint Optical Flow and Scene Flow Estimation

投稿日: 2023年9月27日作成者: jarxiv

要約最近、2D オプティカルフローと 3D シーンフローを共同推定するため … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

The Surveillance AI Pipeline

投稿日: 2023年9月27日作成者: jarxiv

要約 AI研究、特にコンピュータビジョンが大量監視と密接に結びついていると主張す … 続きを読む →

カテゴリー: cs.CV, cs.CY | コメントを受け付けていません

Video-adverb retrieval with compositional adverb-action embeddings

投稿日: 2023年9月27日作成者: jarxiv

要約ビデオ内のアクションを説明する副詞を取得することは、ビデオを詳細に理解する … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

VideoDirectorGPT: Consistent Multi-scene Video Generation via LLM-Guided Planning

投稿日: 2023年9月27日作成者: jarxiv

要約最近のテキストからビデオへの (T2V) 生成方法は大幅な進歩を遂げていま … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Case Study: Ensemble Decision-Based Annotation of Unconstrained Real Estate Images

投稿日: 2023年9月27日作成者: jarxiv

要約シンプルな反復ルールベースの半教師あり学習を使用して、不動産画像に注釈を付 … 続きを読む →

カテゴリー: 68, cs.CV, I.4.8 | コメントを受け付けていません

Binarized Spectral Compressive Imaging

投稿日: 2023年9月27日作成者: jarxiv

要約ハイパースペクトル画像 (HSI) 再構成用の既存の深層学習モデルは優れた … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

LAVIE: High-Quality Video Generation with Cascaded Latent Diffusion Models

投稿日: 2023年9月27日作成者: jarxiv

要約この研究は、事前トレーニングされたテキストから画像への (T2I) モデル … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DistillBEV: Boosting Multi-Camera 3D Object Detection with Cross-Modal Knowledge Distillation

投稿日: 2023年9月27日作成者: jarxiv

要約カメラは自動運転業界での大量生産に費用対効果が高いため、マルチカメラの鳥瞰 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

月別アーカイブ: 2023年9月

Class Incremental Learning via Likelihood Ratio Based Task Prediction

Language-EXtended Indoor SLAM (LEXIS): A Versatile System for Real-time Visual Scene Understanding

RPEFlow: Multimodal Fusion of RGB-PointCloud-Event for Joint Optical Flow and Scene Flow Estimation

The Surveillance AI Pipeline

Video-adverb retrieval with compositional adverb-action embeddings

VideoDirectorGPT: Consistent Multi-scene Video Generation via LLM-Guided Planning

Case Study: Ensemble Decision-Based Annotation of Unconstrained Real Estate Images

Binarized Spectral Compressive Imaging

LAVIE: High-Quality Video Generation with Cascaded Latent Diffusion Models

DistillBEV: Boosting Multi-Camera 3D Object Detection with Cross-Modal Knowledge Distillation

最近の投稿

最近のコメント

アーカイブ

カテゴリー