-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年7月
STARS: Self-supervised Tuning for 3D Action Recognition in Skeleton Sequences
要約 マスクされた予測を使用した自己教師あり事前トレーニング手法は、スケルトンベ … 続きを読む
カテゴリー: cs.CV
STARS: Self-supervised Tuning for 3D Action Recognition in Skeleton Sequences はコメントを受け付けていません
IDOL: Unified Dual-Modal Latent Diffusion for Human-Centric Joint Video-Depth Generation
要約 人間中心のビデオ生成は大幅に進歩しましたが、ビデオ深度の共同生成の問題は依 … 続きを読む
カテゴリー: cs.CV
IDOL: Unified Dual-Modal Latent Diffusion for Human-Centric Joint Video-Depth Generation はコメントを受け付けていません
SQ-LLaVA: Self-Questioning for Large Vision-Language Assistant
要約 視覚言語モデルの最近の進歩により、視覚的命令の調整を通じて幅広いタスクが顕 … 続きを読む
GRUtopia: Dream General Robots in a City at Scale
要約 最近の研究では、身体化された AI の分野におけるスケーリングの法則を調査 … 続きを読む
Can Textual Semantics Mitigate Sounding Object Segmentation Preference?
要約 オーディオビジュアルセグメンテーション (AVS) タスクは、オーディオキ … 続きを読む
カテゴリー: cs.CV
Can Textual Semantics Mitigate Sounding Object Segmentation Preference? はコメントを受け付けていません
Ref-AVS: Refer and Segment Objects in Audio-Visual Scenes
要約 従来の参照セグメンテーション タスクは主に静かな視覚シーンに焦点を当ててお … 続きを読む
InVi: Object Insertion In Videos Using Off-the-Shelf Diffusion Models
要約 既製のテキストから画像への潜在拡散モデルを使用して、ビデオ内のオブジェクト … 続きを読む
カテゴリー: cs.CV
InVi: Object Insertion In Videos Using Off-the-Shelf Diffusion Models はコメントを受け付けていません
Multi-Attention Integrated Deep Learning Frameworks for Enhanced Breast Cancer Segmentation and Identification
要約 乳がんは世界中で生命に深刻な脅威を与えており、毎年多くの命が奪われています … 続きを読む
No Train, all Gain: Self-Supervised Gradients Improve Deep Frozen Representations
要約 このペーパーでは、自己教師あり勾配を活用してビジョン エンコーダーの機能を … 続きを読む
VGBench: Evaluating Large Language Models on Vector Graphics Understanding and Generation
要約 視覚モデルの領域では、主な表現モードはピクセルを使用して視覚世界をラスタラ … 続きを読む