-
最近の投稿
- A Simulation-Free Deep Learning Approach to Stochastic Optimal Control
- Beyond FVD: Enhanced Evaluation Metrics for Video Generation Quality
- Efficient Inference for Large Language Model-based Generative Recommendation
- SparsePO: Controlling Preference Alignment of LLMs via Sparse Token Masks
- Goal-Conditioned Terminal Value Estimation for Real-time and Multi-task Model Predictive Control
-
最近のコメント
表示できるコメントはありません。 cs.AI (27779) cs.CL (20994) cs.CR (2177) cs.CV (34494) cs.LG (32525) cs.RO (15918) cs.SY (2473) eess.IV (4231) eess.SY (2467) stat.ML (4356)
月別アーカイブ: 2023年9月
Class Incremental Learning via Likelihood Ratio Based Task Prediction
要約 クラス増分学習 (CIL) は、一連のタスクを順番に学習する、継続的な学習 … 続きを読む
Language-EXtended Indoor SLAM (LEXIS): A Versatile System for Real-time Visual Scene Understanding
要約 多用途かつ適応的な意味理解により、自律システムが周囲の環境を理解し、相互作 … 続きを読む
RPEFlow: Multimodal Fusion of RGB-PointCloud-Event for Joint Optical Flow and Scene Flow Estimation
要約 最近、2D オプティカル フローと 3D シーン フローを共同推定するため … 続きを読む
カテゴリー: cs.CV
RPEFlow: Multimodal Fusion of RGB-PointCloud-Event for Joint Optical Flow and Scene Flow Estimation はコメントを受け付けていません
The Surveillance AI Pipeline
要約 AI研究、特にコンピュータビジョンが大量監視と密接に結びついていると主張す … 続きを読む
Video-adverb retrieval with compositional adverb-action embeddings
要約 ビデオ内のアクションを説明する副詞を取得することは、ビデオを詳細に理解する … 続きを読む
カテゴリー: cs.CV
Video-adverb retrieval with compositional adverb-action embeddings はコメントを受け付けていません
VideoDirectorGPT: Consistent Multi-scene Video Generation via LLM-Guided Planning
要約 最近のテキストからビデオへの (T2V) 生成方法は大幅な進歩を遂げていま … 続きを読む
Case Study: Ensemble Decision-Based Annotation of Unconstrained Real Estate Images
要約 シンプルな反復ルールベースの半教師あり学習を使用して、不動産画像に注釈を付 … 続きを読む
Binarized Spectral Compressive Imaging
要約 ハイパースペクトル画像 (HSI) 再構成用の既存の深層学習モデルは優れた … 続きを読む
LAVIE: High-Quality Video Generation with Cascaded Latent Diffusion Models
要約 この研究は、事前トレーニングされたテキストから画像への (T2I) モデル … 続きを読む
カテゴリー: cs.CV
LAVIE: High-Quality Video Generation with Cascaded Latent Diffusion Models はコメントを受け付けていません
DistillBEV: Boosting Multi-Camera 3D Object Detection with Cross-Modal Knowledge Distillation
要約 カメラは自動運転業界での大量生産に費用対効果が高いため、マルチカメラの鳥瞰 … 続きを読む