-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
DSG-World: Learning a 3D Gaussian World Model from Dual State Videos
要約 限られた観察から効率的で身体的に一貫した世界モデルを構築することは、ビジョ … 続きを読む
カテゴリー: cs.CV
DSG-World: Learning a 3D Gaussian World Model from Dual State Videos はコメントを受け付けていません
MonkeyOCR: Document Parsing with a Structure-Recognition-Relation Triplet Paradigm
要約 構造認識関連(SRR)トリプレットパラダイムを活用することにより、最新のア … 続きを読む
カテゴリー: cs.CV
MonkeyOCR: Document Parsing with a Structure-Recognition-Relation Triplet Paradigm はコメントを受け付けていません
SAM-aware Test-time Adaptation for Universal Medical Image Segmentation
要約 セグメントを使用したユニバーサル医療画像セグメンテーションAnything … 続きを読む
カテゴリー: cs.CV
SAM-aware Test-time Adaptation for Universal Medical Image Segmentation はコメントを受け付けていません
MAC-Gaze: Motion-Aware Continual Calibration for Mobile Gaze Tracking
要約 モバイルの視線追跡は基本的な課題に直面しています。ユーザーが自然に姿勢やデ … 続きを読む
Stochastic Poisson Surface Reconstruction with One Solve using Geometric Gaussian Processes
要約 ポアソン表面再構築は、配向点クラウドから表面を再構築するための広く使用され … 続きを読む
Aligning Latent Spaces with Flow Priors
要約 このペーパーでは、流れベースの生成モデルを事前に活用することにより、学習可 … 続きを読む
DEFAME: Dynamic Evidence-based FAct-checking with Multimodal Experts
要約 偽情報の拡散は、信頼性が高くスケーラブルな事実確認ソリューションを必要とし … 続きを読む
Spatiotemporal Contrastive Learning for Cross-View Video Localization in Unstructured Off-road Terrains
要約 GPSが除外するオフロード環境における堅牢なクロスビュー3-DOFローカリ … 続きを読む
LeanPO: Lean Preference Optimization for Likelihood Alignment in Video-LLMs
要約 ほとんどのビデオ大規模な言語モデル(ビデオ-LLM)は、優先アライメント手 … 続きを読む
カテゴリー: cs.CV
LeanPO: Lean Preference Optimization for Likelihood Alignment in Video-LLMs はコメントを受け付けていません
Can Foundation Models Generalise the Presentation Attack Detection Capabilities on ID Cards?
要約 現在、IDカードのプレゼンテーション攻撃検出(PAD)の主な課題の1つは、 … 続きを読む
カテゴリー: cs.CV
Can Foundation Models Generalise the Presentation Attack Detection Capabilities on ID Cards? はコメントを受け付けていません