-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Stroke-based Cyclic Amplifier: Image Super-Resolution at Arbitrary Ultra-Large Scales
要約 以前の任意のスケール画像スーパー解像度(ASISR)メソッドは、アップサン … 続きを読む
SlotPi: Physics-informed Object-centric Reasoning Models
要約 現実世界の人間の能力に似た視覚的観察を通じて、物理的法則によって支配される … 続きを読む
Human-Robot Navigation using Event-based Cameras and Reinforcement Learning
要約 この作業では、イベントカメラとその他のセンサーを補強学習と組み合わせて、リ … 続きを読む
カテゴリー: cs.CV
Human-Robot Navigation using Event-based Cameras and Reinforcement Learning はコメントを受け付けていません
Modality-AGnostic Image Cascade (MAGIC) for Multi-Modality Cardiac Substructure Segmentation
要約 心臓の下部構造は、放射線誘発性心疾患のリスクを最小限に抑えるために胸部放射 … 続きを読む
カテゴリー: cs.CV, physics.med-ph
Modality-AGnostic Image Cascade (MAGIC) for Multi-Modality Cardiac Substructure Segmentation はコメントを受け付けていません
Prompts to Summaries: Zero-Shot Language-Guided Video Summarization
要約 ビデオデータの爆発的な成長により、ドメイン固有のトレーニングデータなしで動 … 続きを読む
カテゴリー: cs.CV
Prompts to Summaries: Zero-Shot Language-Guided Video Summarization はコメントを受け付けていません
Unsupervised Deformable Image Registration with Structural Nonparametric Smoothing
要約 学習ベースの変形可能な画像登録(DIR)は、ニューラルネットワークを介した … 続きを読む
Occlusion-Aware 3D Hand-Object Pose Estimation with Masked AutoEncoders
要約 単眼のRGB画像からのハンドオブジェクトのポーズ推定は、主に手観書の相互作 … 続きを読む
カテゴリー: cs.CV
Occlusion-Aware 3D Hand-Object Pose Estimation with Masked AutoEncoders はコメントを受け付けていません
VideoDeepResearch: Long Video Understanding With Agentic Tool Using
要約 長いビデオ理解(LVU)は、タスクに固有の複雑さとコンテキストウィンドウの … 続きを読む
Generalist Models in Medical Image Segmentation: A Survey and Performance Comparison with Task-Specific Approaches
要約 大規模な言語モデルのパラダイムシフトが成功し、データの大規模なコーパスでの … 続きを読む
Video-CoT: A Comprehensive Dataset for Spatiotemporal Understanding of Videos Based on Chain-of-Thought
要約 ビデオ分析からインタラクティブなシステムに至るまで、ビデオコンテンツの理解 … 続きを読む
カテゴリー: cs.CV
Video-CoT: A Comprehensive Dataset for Spatiotemporal Understanding of Videos Based on Chain-of-Thought はコメントを受け付けていません