-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Towards Generalist Robot Policies: What Matters in Building Vision-Language-Action Models
要約 Foundation Vision Language Models (VL … 続きを読む
Editing Implicit and Explicit Representations of Radiance Fields: A Survey
要約 Neural Radiance Fields (NeRF) は、コンパクト … 続きを読む
カテゴリー: cs.CV
Editing Implicit and Explicit Representations of Radiance Fields: A Survey はコメントを受け付けていません
Detail-Preserving Latent Diffusion for Stable Shadow Removal
要約 複雑なグローバル イルミネーションのあるシーンでは、強力な汎用性を備えた高 … 続きを読む
カテゴリー: cs.CV
Detail-Preserving Latent Diffusion for Stable Shadow Removal はコメントを受け付けていません
ANID: How Far Are We? Evaluating the Discrepancies Between AI-synthesized Images and Natural Images through Multimodal Guidance
要約 急速に進化する人工知能生成コンテンツ (AIGC) の分野における重要な課 … 続きを読む
Evaluating Image Hallucination in Text-to-Image Generation with Question-Answering
要約 Text-to-Image(TTI)生成モデルは目覚ましい成功を収めている … 続きを読む
LangSurf: Language-Embedded Surface Gaussians for 3D Scene Understanding
要約 3D シーンを理解するためにガウス スプラッティングを知覚タスクに適用する … 続きを読む
カテゴリー: cs.CV
LangSurf: Language-Embedded Surface Gaussians for 3D Scene Understanding はコメントを受け付けていません
SCBench: A Sports Commentary Benchmark for Video LLMs
要約 最近、学術界と産業界の両方でビデオ大規模言語モデル (ビデオ LLM) が … 続きを読む
Hierarchical Vector Quantization for Unsupervised Action Segmentation
要約 この研究では、教師なし時間アクション セグメンテーションに取り組みます。こ … 続きを読む
カテゴリー: cs.CV
Hierarchical Vector Quantization for Unsupervised Action Segmentation はコメントを受け付けていません
DreamFit: Garment-Centric Human Generation via a Lightweight Anything-Dressing Encoder
要約 テキストまたは画像プロンプトから衣服を中心とした人間を生成するための拡散モ … 続きを読む
カテゴリー: cs.CV
DreamFit: Garment-Centric Human Generation via a Lightweight Anything-Dressing Encoder はコメントを受け付けていません
Enhanced Temporal Processing in Spiking Neural Networks for Static Object Detection Using 3D Convolutions
要約 スパイキング ニューラル ネットワーク (SNN) は、時空間情報を処理で … 続きを読む