-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Comparative Analysis of Machine Learning Models for Lung Cancer Mutation Detection and Staging Using 3D CT Scans
要約 肺がんは世界中の癌死亡率の主な原因であり、重要な突然変異と病期分類を検出す … 続きを読む
SAM-R1: Leveraging SAM for Reward Feedback in Multimodal Segmentation via Reinforcement Learning
要約 画像セグメンテーションのためのマルチモーダル大規模モデルを活用することは、 … 続きを読む
カテゴリー: cs.CV
SAM-R1: Leveraging SAM for Reward Feedback in Multimodal Segmentation via Reinforcement Learning はコメントを受け付けていません
An Effective Training Framework for Light-Weight Automatic Speech Recognition Models
要約 深い学習における最近の進歩により、計算およびメモリの制約を無視しながら有望 … 続きを読む
カテゴリー: cs.CV
An Effective Training Framework for Light-Weight Automatic Speech Recognition Models はコメントを受け付けていません
Adversarially Robust AI-Generated Image Detection for Free: An Information Theoretic Perspective
要約 人工知能生成画像(AIGI)の急速な進歩により、偽造や誤った情報などの悪意 … 続きを読む
カテゴリー: cs.CV
Adversarially Robust AI-Generated Image Detection for Free: An Information Theoretic Perspective はコメントを受け付けていません
Chest Disease Detection In X-Ray Images Using Deep Learning Classification Method
要約 この作業では、複数の分類モデルのパフォーマンスを調査して、胸部X線画像をC … 続きを読む
Shielded Diffusion: Generating Novel and Diverse Images using Sparse Repellency
要約 テキスト間拡散モデルの採用は、信頼性に対する懸念を引き起こし、キャリブレー … 続きを読む
RICO: Improving Accuracy and Completeness in Image Recaptioning via Visual Reconstruction
要約 画像の復帰は、さまざまなマルチモーダルタスクの品質が向上したトレーニングデ … 続きを読む
PS4PRO: Pixel-to-pixel Supervision for Photorealistic Rendering and Optimization
要約 ニューラルレンダリング方法は、2D画像から3Dシーンを再構築する能力に大き … 続きを読む
Chain-of-Talkers (CoTalk): Fast Human Annotation of Dense Image Captions
要約 密に注釈付きの画像キャプションは、堅牢な視覚系のアラインメントの学習を大幅 … 続きを読む