-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Towards Harmless Multimodal Assistants with Blind Preference Optimization
要約 マルチモーダル大手言語モデル(MLLM)は、マルチモーダルの理解、推論、お … 続きを読む
Zero-Shot Action Recognition in Surveillance Videos
要約 公共スペースでの監視に対する需要の高まりは、人的資源の不足により大きな課題 … 続きを読む
Bracket Diffusion: HDR Image Generation by Consistent LDR Denoising
要約 複数のブラックボックス、事前に訓練されたLDR画像拡散モデルの協調アクショ … 続きを読む
DualToken: Towards Unifying Visual Understanding and Generation with Dual Visual Vocabularies
要約 視覚的理解と生成に必要な異なる表現スペースは、大規模な言語モデルの自己回帰 … 続きを読む
BiTrack: Bidirectional Offline 3D Multi-Object Tracking Using Camera-LiDAR Data
要約 リアルタイムマルチオブジェクトトラッキング(MOT)と比較して、オフライン … 続きを読む
LeanVAE: An Ultra-Efficient Reconstruction VAE for Video Diffusion Models
要約 潜在的なビデオ拡散モデル(LVDMS)の最近の進歩は、ビデオ変動自動エンコ … 続きを読む
EvolvingGrasp: Evolutionary Grasp Generation via Efficient Preference Alignment
要約 器用なロボットの手は、低ダイバーシティデータで訓練されたモデルの制限により … 続きを読む
カテゴリー: cs.CV
EvolvingGrasp: Evolutionary Grasp Generation via Efficient Preference Alignment はコメントを受け付けていません
ADAPT: An Autonomous Forklift for Construction Site Operation
要約 効率的な材料物流は、建設業界のコストとスケジュールを管理する上で重要な役割 … 続きを読む
DreamRunner: Fine-Grained Compositional Story-to-Video Generation with Retrieval-Augmented Motion Adaptation
要約 ストーリーテリングビデオジェネレーション(SVG)は、構造化された物語に続 … 続きを読む
Multi-Prototype Embedding Refinement for Semi-Supervised Medical Image Segmentation
要約 医療画像セグメンテーションは、ボクセルレベルの解剖学的構造を特定することを … 続きを読む