-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年2月
Video ReCap: Recursive Captioning of Hour-Long Videos
要約 ほとんどのビデオキャプションモデルは、数秒の短いビデオクリップを処理し、低 … 続きを読む
カテゴリー: cs.CV
Video ReCap: Recursive Captioning of Hour-Long Videos はコメントを受け付けていません
Probabilistic Bayesian optimal experimental design using conditional normalizing flows
要約 ベイズ最適実験計画 (OED) は、予算制約の下で最も有益な実験を実施し、 … 続きを読む
LatentSwap: An Efficient Latent Code Mapping Framework for Face Swapping
要約 私たちは、特定のジェネレーターの顔交換潜在コードを生成する単純な顔交換フレ … 続きを読む
カテゴリー: cs.CV
LatentSwap: An Efficient Latent Code Mapping Framework for Face Swapping はコメントを受け付けていません
Controlling Vision-Language Models for Multi-Task Image Restoration
要約 CLIP などのビジョン言語モデルは、ゼロショットまたはラベルフリー予測の … 続きを読む
カテゴリー: cs.CV
Controlling Vision-Language Models for Multi-Task Image Restoration はコメントを受け付けていません
Objective and Interpretable Breast Cosmesis Evaluation with Attention Guided Denoising Diffusion Anomaly Detection Model
要約 乳がん治療分野の進歩が進むにつれて、患者の生活の質に大きな影響を与えるため … 続きを読む
SegForestNet: Spatial-Partitioning-Based Aerial Image Segmentation
要約 航空画像セグメンテーションは、地図の自動作成や森林伐採の追跡などのアプリケ … 続きを読む
Robust Quantification of Percent Emphysema on CT via Domain Attention: the Multi-Ethnic Study of Atherosclerosis (MESA) Lung Study
要約 コンピューター断層撮影 (CT) による肺気腫の確実な定量化は、さまざまな … 続きを読む
カテゴリー: cs.CV
Robust Quantification of Percent Emphysema on CT via Domain Attention: the Multi-Ethnic Study of Atherosclerosis (MESA) Lung Study はコメントを受け付けていません
Rethinking Centered Kernel Alignment in Knowledge Distillation
要約 知識の蒸留は、大規模モデルと軽量モデルの間の表現の不一致を埋めるための非常 … 続きを読む
カテゴリー: cs.CV
Rethinking Centered Kernel Alignment in Knowledge Distillation はコメントを受け付けていません
A Modular System for Enhanced Robustness of Multimedia Understanding Networks via Deep Parametric Estimation
要約 マルチメディア理解タスクでは、破損したサンプルが機械学習モデルに供給される … 続きを読む
カテゴリー: cs.CV
A Modular System for Enhanced Robustness of Multimedia Understanding Networks via Deep Parametric Estimation はコメントを受け付けていません
A Cognitive Evaluation Benchmark of Image Reasoning and Description for Large Vision Language Models
要約 Large Vision Language Model (LVLM) は、 … 続きを読む