-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Harnessing Superclasses for Learning from Hierarchical Databases
要約 多くの大規模な分類問題では、クラスは既知の階層で編成され、通常はスーパーク … 続きを読む
AnonyNoise: Anonymizing Event Data with Smart Noise to Outsmart Re-Identification and Preserve Privacy
要約 ディープ ニューラル ネットワークの再識別機能の向上は、近年の公衆監視の強 … 続きを読む
カテゴリー: cs.CV
AnonyNoise: Anonymizing Event Data with Smart Noise to Outsmart Re-Identification and Preserve Privacy はコメントを受け付けていません
SplatFlow: Multi-View Rectified Flow Model for 3D Gaussian Splatting Synthesis
要約 テキストベースの 3D シーンの生成と編集には、直感的なユーザー インタラ … 続きを読む
カテゴリー: cs.CV
SplatFlow: Multi-View Rectified Flow Model for 3D Gaussian Splatting Synthesis はコメントを受け付けていません
VQ-SGen: A Vector Quantized Stroke Representation for Sketch Generation
要約 本稿では、高品質なスケッチ生成のための新しいアルゴリズムである VQ-SG … 続きを読む
VidComposition: Can MLLMs Analyze Compositions in Compiled Videos?
要約 マルチモーダル大規模言語モデル (MLLM) の進歩により、マルチモーダル … 続きを読む
No Identity, no problem: Motion through detection for people tracking
要約 検出による追跡は、人物追跡の事実上の標準アプローチとなっています。 堅牢性 … 続きを読む
Efficient Video Face Enhancement with Enhanced Spatial-Temporal Consistency
要約 非常に一般的な種類のビデオとして、顔ビデオは映画、トーク ショー、生放送、 … 続きを読む
カテゴリー: cs.CV
Efficient Video Face Enhancement with Enhanced Spatial-Temporal Consistency はコメントを受け付けていません
Deformable Mamba for Wide Field of View Segmentation
要約 魚眼やパノラマ設定などの広視野カメラは、より広範囲の知覚に不可欠ですが、1 … 続きを読む
カテゴリー: cs.CV
Deformable Mamba for Wide Field of View Segmentation はコメントを受け付けていません
Multi-Resolution Generative Modeling of Human Motion from Limited Data
要約 限られたトレーニング シーケンスから人間の動きを合成することを学習する生成 … 続きを読む
@Bench: Benchmarking Vision-Language Models for Human-centered Assistive Technology
要約 視覚言語モデル (VLM) が進歩するにつれて、視覚障害者 (PVI) を … 続きを読む
カテゴリー: cs.CV
@Bench: Benchmarking Vision-Language Models for Human-centered Assistive Technology はコメントを受け付けていません