-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
From Play to Replay: Composed Video Retrieval for Temporally Fine-Grained Videos
要約 Composed Video Retrieval(COVR)は、クエリビデ … 続きを読む
カテゴリー: cs.CV
From Play to Replay: Composed Video Retrieval for Temporally Fine-Grained Videos はコメントを受け付けていません
Unifying Appearance Codes and Bilateral Grids for Driving Scene Gaussian Splatting
要約 NERFやGaussian Splatting(GS)を含むニューラルレン … 続きを読む
カテゴリー: cs.CV
Unifying Appearance Codes and Bilateral Grids for Driving Scene Gaussian Splatting はコメントを受け付けていません
Rectified Point Flow: Generic Point Cloud Pose Estimation
要約 ペアワイズポイントクラウド登録とマルチパート形状アセンブリを単一の条件付き … 続きを読む
Video World Models with Long-term Spatial Memory
要約 新しい世界モデルは、カメラの動きやテキストプロンプトなどのアクションに応じ … 続きを読む
カテゴリー: cs.CV
Video World Models with Long-term Spatial Memory はコメントを受け付けていません
RaySt3R: Predicting Novel Depth Maps for Zero-Shot Object Completion
要約 3D Shape Compleyは、ロボット工学、デジタルツイン再建、およ … 続きを読む
カテゴリー: cs.CV
RaySt3R: Predicting Novel Depth Maps for Zero-Shot Object Completion はコメントを受け付けていません
Stable Vision Concept Transformers for Medical Diagnosis
要約 透明性は医療分野で最も重要な懸念であり、研究者が説明可能なAI(XAI)の … 続きを読む
EOC-Bench: Can MLLMs Identify, Recall, and Forecast Objects in an Egocentric World?
要約 マルチモーダル大手言語モデル(MLLMS)の出現により、エゴセントリックビ … 続きを読む
カテゴリー: cs.CV
EOC-Bench: Can MLLMs Identify, Recall, and Forecast Objects in an Egocentric World? はコメントを受け付けていません
AliTok: Towards Sequence Modeling Alignment between Tokenizer and Autoregressive Model
要約 オートレーリングイメージの生成は、以前のトークンに基づいて次のトークンを予 … 続きを読む
カテゴリー: cs.CV
AliTok: Towards Sequence Modeling Alignment between Tokenizer and Autoregressive Model はコメントを受け付けていません
DM-SegNet: Dual-Mamba Architecture for 3D Medical Image Segmentation with Global Context Modeling
要約 正確な3D医療画像セグメンテーションには、グローバルなコンテキストモデリン … 続きを読む
SeedVR2: One-Step Video Restoration via Diffusion Adversarial Post-Training
要約 拡散ベースのビデオ修復(VR)の最近の進歩は、視覚品質の大幅な改善を示して … 続きを読む
カテゴリー: cs.CV
SeedVR2: One-Step Video Restoration via Diffusion Adversarial Post-Training はコメントを受け付けていません