-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
VideoLLaMA 3: Frontier Multimodal Foundation Models for Image and Video Understanding
要約 この論文では、画像とビデオを理解するためのより高度なマルチモーダル基盤モデ … 続きを読む
カテゴリー: cs.CV
VideoLLaMA 3: Frontier Multimodal Foundation Models for Image and Video Understanding はコメントを受け付けていません
Accelerate High-Quality Diffusion Models with Inner Loop Feedback
要約 私たちは、拡散モデルの推論を加速する新しいアプローチであるインナー ループ … 続きを読む
カテゴリー: cs.CV
Accelerate High-Quality Diffusion Models with Inner Loop Feedback はコメントを受け付けていません
SANER: Annotation-free Societal Attribute Neutralizer for Debiasing CLIP
要約 CLIP などの大規模な視覚言語モデルには、保護される属性 (性別、年齢な … 続きを読む
カテゴリー: cs.CV
SANER: Annotation-free Societal Attribute Neutralizer for Debiasing CLIP はコメントを受け付けていません
Video Depth Anything: Consistent Depth Estimation for Super-Long Videos
要約 Depth Anything は、強力な一般化能力により、単眼の深度推定に … 続きを読む
InternVideo2.5: Empowering Video MLLMs with Long and Rich Context Modeling
要約 このペーパーは、ロング アンド リッチ コンテキスト (LRC) モデリン … 続きを読む
カテゴリー: cs.CV
InternVideo2.5: Empowering Video MLLMs with Long and Rich Context Modeling はコメントを受け付けていません
Teacher Encoder-Student Decoder Denoising Guided Segmentation Network for Anomaly Detection
要約 視覚的異常の検出は非常に困難なタスクであり、多くの場合、1 クラスの分類お … 続きを読む
HAC++: Towards 100X Compression of 3D Gaussian Splatting
要約 3D ガウス スプラッティング (3DGS) は、高い忠実度で高速なレンダ … 続きを読む
カテゴリー: cs.CV
HAC++: Towards 100X Compression of 3D Gaussian Splatting はコメントを受け付けていません
GPS as a Control Signal for Image Generation
要約 写真メタデータに含まれる GPS タグが画像生成に有用な制御信号を提供する … 続きを読む
カテゴリー: cs.CV
GPS as a Control Signal for Image Generation はコメントを受け付けていません
Unsupervised UAV 3D Trajectories Estimation with Sparse Point Clouds
要約 コンパクトな UAV システムは、配送と監視を進化させる一方で、そのサイズ … 続きを読む
A Survey of World Models for Autonomous Driving
要約 自動運転における最近の進歩により、車両が周囲を認識し、周囲と相互作用する方 … 続きを読む