-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Parallel Sequence Modeling via Generalized Spatial Propagation Network
要約 本質的に 2D 空間構造を捕捉する視覚タスク用に最適化された新しい注意メカ … 続きを読む
DiffDoctor: Diagnosing Image Diffusion Models Before Treating
要約 最近の進歩にもかかわらず、画像拡散モデルは依然としてアーチファクトを生成し … 続きを読む
カテゴリー: cs.CV
DiffDoctor: Diagnosing Image Diffusion Models Before Treating はコメントを受け付けていません
CCESAR: Coastline Classification-Extraction From SAR Images Using CNN-U-Net Combination
要約 この記事では、画像分類とそれに続くセグメンテーションを含む 2 段階のモデ … 続きを読む
InternVideo2.5: Empowering Video MLLMs with Long and Rich Context Modeling
要約 このペーパーは、ロング アンド リッチ コンテキスト (LRC) モデリン … 続きを読む
カテゴリー: cs.CV
InternVideo2.5: Empowering Video MLLMs with Long and Rich Context Modeling はコメントを受け付けていません
Continuous 3D Perception Model with Persistent State
要約 幅広い 3D タスクを解決できる統合フレームワークを紹介します。 私たちの … 続きを読む
カテゴリー: cs.CV
Continuous 3D Perception Model with Persistent State はコメントを受け付けていません
Taming Teacher Forcing for Masked Autoregressive Video Generation
要約 フレーム内生成のためのマスクされたモデリングと次のフレーム生成のための因果 … 続きを読む
カテゴリー: cs.CV
Taming Teacher Forcing for Masked Autoregressive Video Generation はコメントを受け付けていません
GPS as a Control Signal for Image Generation
要約 写真メタデータに含まれる GPS タグが画像生成に有用な制御信号を提供する … 続きを読む
カテゴリー: cs.CV
GPS as a Control Signal for Image Generation はコメントを受け付けていません
Learning segmentation from point trajectories
要約 私たちは、他の形式の監視ではなく、動きに基づいてビデオ内のオブジェクトをセ … 続きを読む
Towards Affordance-Aware Articulation Synthesis for Rigged Objects
要約 リグ付きオブジェクトは、さまざまなシーンや姿勢に柔軟に適応できるため、アー … 続きを読む
カテゴリー: cs.CV
Towards Affordance-Aware Articulation Synthesis for Rigged Objects はコメントを受け付けていません
FoundationStereo: Zero-Shot Stereo Matching
要約 ドメインごとの微調整により、ベンチマーク データセットで優れたディープ ス … 続きを読む