-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年1月
CCESAR: Coastline Classification-Extraction From SAR Images Using CNN-U-Net Combination
要約 この記事では、画像分類とそれに続くセグメンテーションを含む 2 段階のモデ … 続きを読む
InternVideo2.5: Empowering Video MLLMs with Long and Rich Context Modeling
要約 このペーパーは、ロング アンド リッチ コンテキスト (LRC) モデリン … 続きを読む
カテゴリー: cs.CV
InternVideo2.5: Empowering Video MLLMs with Long and Rich Context Modeling はコメントを受け付けていません
Continuous 3D Perception Model with Persistent State
要約 幅広い 3D タスクを解決できる統合フレームワークを紹介します。 私たちの … 続きを読む
カテゴリー: cs.CV
Continuous 3D Perception Model with Persistent State はコメントを受け付けていません
Taming Teacher Forcing for Masked Autoregressive Video Generation
要約 フレーム内生成のためのマスクされたモデリングと次のフレーム生成のための因果 … 続きを読む
カテゴリー: cs.CV
Taming Teacher Forcing for Masked Autoregressive Video Generation はコメントを受け付けていません
GPS as a Control Signal for Image Generation
要約 写真メタデータに含まれる GPS タグが画像生成に有用な制御信号を提供する … 続きを読む
カテゴリー: cs.CV
GPS as a Control Signal for Image Generation はコメントを受け付けていません
Learning segmentation from point trajectories
要約 私たちは、他の形式の監視ではなく、動きに基づいてビデオ内のオブジェクトをセ … 続きを読む
Towards Affordance-Aware Articulation Synthesis for Rigged Objects
要約 リグ付きオブジェクトは、さまざまなシーンや姿勢に柔軟に適応できるため、アー … 続きを読む
カテゴリー: cs.CV
Towards Affordance-Aware Articulation Synthesis for Rigged Objects はコメントを受け付けていません
FoundationStereo: Zero-Shot Stereo Matching
要約 ドメインごとの微調整により、ベンチマーク データセットで優れたディープ ス … 続きを読む
GSTAR: Gaussian Surface Tracking and Reconstruction
要約 3D ガウス スプラッティング技術により、静的シーンの効率的な写真のように … 続きを読む
カテゴリー: cs.CV
GSTAR: Gaussian Surface Tracking and Reconstruction はコメントを受け付けていません
Mesh2SLAM in VR: A Fast Geometry-Based SLAM Framework for Rapid Prototyping in Virtual Reality Applications
要約 SLAM は、ロボット工学や AR/VR に幅広く応用できる基礎的な技術で … 続きを読む