-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Efficient Flow Matching using Latent Variables
要約 フローマッチングモデルは、確率的生成モデルの間で画像生成タスクに大きな可能 … 続きを読む
‘I Can See Forever!’: Evaluating Real-time VideoLLMs for Assisting Individuals with Visual Impairments
要約 視覚障害のある人口、特に重度の視覚障害者は現在大きく、日々の活動は彼らにと … 続きを読む
Defining and Quantifying Creative Behavior in Popular Image Generators
要約 生成AIモデルの創造性は、決定的な答えなしに、過去数年間で科学的議論の対象 … 続きを読む
Leveraging Simultaneous Usage of Edge GPU Hardware Engines for Video Face Detection and Recognition
要約 セキュリティの強化や認可された会場への非接触アクセスなど、いくつかのアプリ … 続きを読む
XLD: A Cross-Lane Dataset for Benchmarking Novel Driving View Synthesis
要約 自律運転車の安全性を確保するには、シミュレーションによる自律システムの包括 … 続きを読む
カテゴリー: cs.CV
XLD: A Cross-Lane Dataset for Benchmarking Novel Driving View Synthesis はコメントを受け付けていません
HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation
要約 カスタマイズされたビデオジェネレーションは、柔軟なユーザー定義条件下で特定 … 続きを読む
カテゴリー: cs.CV
HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation はコメントを受け付けていません
Text2CT: Towards 3D CT Volume Generation from Free-text Descriptions Using Diffusion Model
要約 記述的なフリーテキスト入力から3D CTボリュームを生成することは、診断と … 続きを読む
カテゴリー: cs.CV
Text2CT: Towards 3D CT Volume Generation from Free-text Descriptions Using Diffusion Model はコメントを受け付けていません
Edge-GPU Based Face Tracking for Face Detection and Recognition Acceleration
要約 リアルタイムで正確な顔の検出と公共の場所での認識に特化した費用対効果の高い … 続きを読む
DFVO: Learning Darkness-free Visible and Infrared Image Disentanglement and Fusion All at Once
要約 可視および赤外線融合は、画像融合の分野で最も重要なタスクの1つであり、高レ … 続きを読む