-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
TeamCraft: A Benchmark for Multi-Modal Multi-Agent Systems in Minecraft
要約 コラボレーションは社会の基礎です。 現実の世界では、人間のチームメイトは多 … 続きを読む
Extrapolated Urban View Synthesis Benchmark
要約 フォトリアリスティックなシミュレーターは、ビジョン中心の自動運転車 (AV … 続きを読む
Mind the Time: Temporally-Controlled Multi-Event Video Generation
要約 現実世界のビデオは一連のイベントで構成されます。 このようなシーケンスを正 … 続きを読む
カテゴリー: cs.CV
Mind the Time: Temporally-Controlled Multi-Event Video Generation はコメントを受け付けていません
DenseMatcher: Learning 3D Semantic Correspondence for Category-Level Manipulation from a Single Demo
要約 密な 3D 対応により、1 つの物体から目に見えない対応物への空間的、機能 … 続きを読む
Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and Test-Time Scaling
要約 InternVL 2.5 は、InternVL 2.0 をベースに構築され … 続きを読む
カテゴリー: cs.CV
Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and Test-Time Scaling はコメントを受け付けていません
SimC3D: A Simple Contrastive 3D Pretraining Framework Using RGB Images
要約 3D 対照学習パラダイムは、点群データでの事前トレーニングを通じて下流タス … 続きを読む
カテゴリー: cs.CV
SimC3D: A Simple Contrastive 3D Pretraining Framework Using RGB Images はコメントを受け付けていません
MotionFlow: Attention-Driven Motion Transfer in Video Diffusion Models
要約 Text-to-Video モデルは、多様で魅力的なビデオ コンテンツを生 … 続きを読む
Text to Blind Motion
要約 視覚障害者は、晴眼者とは世界の認識が異なるため、動作特性が明確になる場合が … 続きを読む
カテゴリー: cs.CV
Text to Blind Motion はコメントを受け付けていません
Sparse autoencoders reveal selective remapping of visual concepts during adaptation
要約 基礎モデルを特定の目的に適合させることは、下流アプリケーション用の機械学習 … 続きを読む
Birth and Death of a Rose
要約 私たちは、事前にトレーニングされた 2D 基礎モデルから、時間的なオブジェ … 続きを読む