-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Anonymization of Documents for Law Enforcement with Machine Learning
要約 法執行機関などの機密性の高い個人情報を扱う分野でデータ駆動型の手法やアプロ … 続きを読む
AI-Driven Early Mental Health Screening: Analyzing Selfies of Pregnant Women
要約 大うつ病性障害と不安障害は世界中で何百万人もの人々に影響を与えており、メン … 続きを読む
A method for estimating roadway billboard salience
要約 道路脇の看板やその他の形式の屋外広告は、マーケティング活動において重要な役 … 続きを読む
カテゴリー: cs.CV
A method for estimating roadway billboard salience はコメントを受け付けていません
Text-Guided Coarse-to-Fine Fusion Network for Robust Remote Sensing Visual Question Answering
要約 リモート センシングによる視覚的質問応答 (RSVQA) は、研究において … 続きを読む
カテゴリー: cs.CV
Text-Guided Coarse-to-Fine Fusion Network for Robust Remote Sensing Visual Question Answering はコメントを受け付けていません
SCC-YOLO: An Improved Object Detector for Assisting in Brain Tumor Diagnosis
要約 脳腫瘍は、神経機能障害、認知および心理状態の変化、頭蓋内圧の上昇、発作の発 … 続きを読む
TimberVision: A Multi-Task Dataset and Framework for Log-Component Segmentation and Tracking in Autonomous Forestry Operations
要約 木材はますます価値が高く、多用途な資源となっています。 しかし、丸太の収穫 … 続きを読む
Point-JEPA: A Joint Embedding Predictive Architecture for Self-Supervised Learning on Point Cloud
要約 点群ドメインにおける自己教師あり学習の最近の進歩により、大きな可能性が実証 … 続きを読む
カテゴリー: cs.CV
Point-JEPA: A Joint Embedding Predictive Architecture for Self-Supervised Learning on Point Cloud はコメントを受け付けていません
GIM: A Million-scale Benchmark for Generative Image Manipulation Detection and Localization
要約 生成モデルの並外れた能力は、画像編集およびリアルな画像の生成における新しい … 続きを読む
カテゴリー: cs.CV
GIM: A Million-scale Benchmark for Generative Image Manipulation Detection and Localization はコメントを受け付けていません
BayesAdapter: enhanced uncertainty estimation in CLIP few-shot adaptation
要約 大規模な事前トレーニング済みビジョン言語モデル (VLM) の出現は、機械 … 続きを読む
Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and Test-Time Scaling
要約 InternVL 2.5 は、InternVL 2.0 をベースに構築され … 続きを読む
カテゴリー: cs.CV
Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and Test-Time Scaling はコメントを受け付けていません