-
最近の投稿
- Physical Reservoir Computing in Hook-Shaped Rover Wheel Spokes for Real-Time Terrain Identification
- Chain-of-Modality: Learning Manipulation Programs from Multimodal Human Videos with Vision-Language-Models
- Multi-Sensor Fusion-Based Mobile Manipulator Remote Control for Intelligent Smart Home Assistance
- Integration of a Graph-Based Path Planner and Mixed-Integer MPC for Robot Navigation in Cluttered Environments
- Demonstrating CavePI: Autonomous Exploration of Underwater Caves by Semantic Guidance
-
最近のコメント
表示できるコメントはありません。 cs.AI (36829) cs.CL (27883) cs.CV (42623) cs.HC (2814) cs.LG (41781) cs.RO (21795) cs.SY (3320) eess.IV (4979) eess.SY (3312) stat.ML (5469)
月別アーカイブ: 2024年6月
Stochastic Conditional Diffusion Models for Robust Semantic Image Synthesis
要約 意味画像合成(SIS)は、意味マップ(ラベル)に対応する現実的な画像を生成 … 続きを読む
カテゴリー: cs.CV
Stochastic Conditional Diffusion Models for Robust Semantic Image Synthesis はコメントを受け付けていません
Video-LaVIT: Unified Video-Language Pre-training with Decoupled Visual-Motional Tokenization
要約 最近のマルチモーダル大規模言語モデル(LLM)の進歩に伴い、画像-テキスト … 続きを読む
Scalable Wasserstein Gradient Flow for Generative Modeling through Unbalanced Optimal Transport
要約 Wasserstein Gradient Flow (WGF)は、Wass … 続きを読む
Portrait4D: Learning One-Shot 4D Head Avatar Synthesis using Synthetic Data
要約 既存の一発4次元頭部合成法は、通常、3DMM再構成の助けを借りて単眼映像か … 続きを読む
カテゴリー: cs.CV
Portrait4D: Learning One-Shot 4D Head Avatar Synthesis using Synthetic Data はコメントを受け付けていません
PLUG: Revisiting Amodal Segmentation with Foundation Model and Hierarchical Focus
要約 部分的に隠蔽された物体の完全な形状を予測することを目的としたアモーダルセグ … 続きを読む
カテゴリー: cs.CV
PLUG: Revisiting Amodal Segmentation with Foundation Model and Hierarchical Focus はコメントを受け付けていません
Rethinking Efficient and Effective Point-based Networks for Event Camera Classification and Regression: EventMamba
要約 生物システムからヒントを得たイベントカメラは、低消費電力でありながら、周囲 … 続きを読む
カテゴリー: cs.CV
Rethinking Efficient and Effective Point-based Networks for Event Camera Classification and Regression: EventMamba はコメントを受け付けていません
Automatic Cranial Defect Reconstruction with Self-Supervised Deep Deformable Masked Autoencoders
要約 毎年、何千人もの人々が頭蓋損傷に苦しんでいる。このような人々には、再建手術 … 続きを読む
DeCoF: Generated Video Detection via Frame Consistency: The First Benchmark Dataset
要約 高度な映像生成手法によって生成される映像の品質が高まるにつれ、新たなセキュ … 続きを読む
Efficient Masked Autoencoders with Self-Consistency
要約 自然言語処理タスクにおけるマスク付き言語モデリング(MLM)に触発されたマ … 続きを読む
カテゴリー: cs.CV
Efficient Masked Autoencoders with Self-Consistency はコメントを受け付けていません
DP-IQA: Utilizing Diffusion Prior for Blind Image Quality Assessment in the Wild
要約 画質評価(IQA)は、一連のアプリケーションにおいて、高品質な画像を選択し … 続きを読む