-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
A Reinforcement Learning-Based Automatic Video Editing Method Using Pre-trained Vision-Language Model
要約 このビデオの時代において、自動ビデオ編集技術は、作業負荷を軽減し、人間の編 … 続きを読む
カテゴリー: cs.CV
A Reinforcement Learning-Based Automatic Video Editing Method Using Pre-trained Vision-Language Model はコメントを受け付けていません
GD doesn’t make the cut: Three ways that non-differentiability affects neural network training
要約 この論文では、非微分可能関数 (NGDM) に適用される勾配法と、微分可能 … 続きを読む
M3DocRAG: Multi-modal Retrieval is What You Need for Multi-page Multi-document Understanding
要約 ドキュメントからの質問に答えるドキュメント ビジュアル質問応答 (DocV … 続きを読む
CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM
要約 このペーパーは、テキスト記述、画像、点群、またはそれらの組み合わせの形式で … 続きを読む
カテゴリー: cs.CV
CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM はコメントを受け付けていません
Uncovering Hidden Subspaces in Video Diffusion Models Using Re-Identification
要約 潜在ビデオ拡散モデルは、生成された画質と時間的一貫性のおかげで、一般の観察 … 続きを読む
VAIR: Visuo-Acoustic Implicit Representations for Low-Cost, Multi-Modal Transparent Surface Reconstruction in Indoor Scenes
要約 屋内で動作する移動ロボットは、透明な表面を含む困難なシーンをナビゲートでき … 続きを読む
カテゴリー: cs.CV
VAIR: Visuo-Acoustic Implicit Representations for Low-Cost, Multi-Modal Transparent Surface Reconstruction in Indoor Scenes はコメントを受け付けていません
A Comparative Analysis of U-Net-based models for Segmentation of Cardiac MRI
要約 医療画像とは、医学的疾患の診断、監視、さらには治療を目的として、人体とその … 続きを読む
AsCAN: Asymmetric Convolution-Attention Networks for Efficient Recognition and Generation
要約 ニューラル ネットワーク アーキテクチャの設計では、多くの重要な決定を行う … 続きを読む
Planar Reflection-Aware Neural Radiance Fields
要約 Neural Radiance Fields (NeRF) は、複雑なシー … 続きを読む
カテゴリー: cs.CV
Planar Reflection-Aware Neural Radiance Fields はコメントを受け付けていません
SG-I2V: Self-Guided Trajectory Control in Image-to-Video Generation
要約 画像からビデオへの生成方法は、印象的で写真のようにリアルな品質を実現しまし … 続きを読む