「cs.CV」カテゴリーアーカイブ

Diffusion Curriculum: Synthetic-to-Real Generative Curriculum Learning via Image-Guided Diffusion

投稿日: 2024年10月21日作成者: jarxiv

要約低品質または希少なデータは、実際にディープニューラルネットワークをトレ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

DAWN: Dynamic Frame Avatar with Non-autoregressive Diffusion Framework for Talking Head Video Generation

投稿日: 2024年10月21日作成者: jarxiv

要約トーキングヘッドの生成は、1 つのポートレートとスピーチオーディオク … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Depth-supervised NeRF: Fewer Views and Faster Training for Free

投稿日: 2024年10月20日作成者: jarxiv

要約 Neural Radiance Field (NeRF) でよく観察される … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.LG | コメントを受け付けていません

Gaussian Splatting to Real World Flight Navigation Transfer with Liquid Networks

投稿日: 2024年10月18日作成者: jarxiv

要約シミュレーターは、スケーラブルなデータ生成、柔軟な設計、軌道の最適化を提供 … 続きを読む →

カテゴリー: 68T40, 68U20, 93C85, cs.AI, cs.CV, cs.RO, I.2.6 | コメントを受け付けていません

Risk Assessment for Autonomous Landing in Urban Environments using Semantic Segmentation

投稿日: 2024年10月18日作成者: jarxiv

要約この論文では、セマンティックセグメンテーションとリスク評価にディープニ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Configurable Embodied Data Generation for Class-Agnostic RGB-D Video Segmentation

投稿日: 2024年10月18日作成者: jarxiv

要約この論文では、さまざまなフォームファクターを持つロボット間でクラスに依存し … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

D$^3$Fields: Dynamic 3D Descriptor Fields for Zero-Shot Generalizable Rearrangement

投稿日: 2024年10月18日作成者: jarxiv

要約シーンの表現は、ロボット操作システムにおける重要な設計上の選択です。理想 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

t-READi: Transformer-Powered Robust and Efficient Multimodal Inference for Autonomous Driving

投稿日: 2024年10月18日作成者: jarxiv

要約自動運転車 (AV) によるマルチモーダルセンサー (カメラ、ライダー、 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.DC, cs.LG, cs.RO | コメントを受け付けていません

H2OVL-Mississippi Vision Language Models Technical Report

投稿日: 2024年10月18日作成者: jarxiv

要約小型ビジョン言語モデル (VLM) は、企業の商業文書や画像を処理するため … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

MEGA: Memory-Efficient 4D Gaussian Splatting for Dynamic Scenes

投稿日: 2024年10月18日作成者: jarxiv

要約 4D ガウススプラッティング (4DGS) は、複雑でダイナミックな 3 … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Diffusion Curriculum: Synthetic-to-Real Generative Curriculum Learning via Image-Guided Diffusion

DAWN: Dynamic Frame Avatar with Non-autoregressive Diffusion Framework for Talking Head Video Generation

Depth-supervised NeRF: Fewer Views and Faster Training for Free

Gaussian Splatting to Real World Flight Navigation Transfer with Liquid Networks

Risk Assessment for Autonomous Landing in Urban Environments using Semantic Segmentation

Configurable Embodied Data Generation for Class-Agnostic RGB-D Video Segmentation

D$^3$Fields: Dynamic 3D Descriptor Fields for Zero-Shot Generalizable Rearrangement

t-READi: Transformer-Powered Robust and Efficient Multimodal Inference for Autonomous Driving

H2OVL-Mississippi Vision Language Models Technical Report

MEGA: Memory-Efficient 4D Gaussian Splatting for Dynamic Scenes

最近の投稿

最近のコメント

アーカイブ

カテゴリー