-
最近の投稿
- QueryCAD: Grounded Question Answering for CAD Models
- Reward-Centered ReST-MCTS: A Robust Decision-Making Framework for Robotic Manipulation in High Uncertainty Environments
- Discrete Contrastive Learning for Diffusion Policies in Autonomous Driving
- HBTP: Heuristic Behavior Tree Planning with Large Language Model Reasoning
- Kaiwu: A Multimodal Manipulation Dataset and Framework for Robot Learning and Human-Robot Interaction
-
最近のコメント
表示できるコメントはありません。 cs.AI (34805) cs.CL (26316) cs.CR (2669) cs.CV (40628) cs.LG (39812) cs.RO (20399) cs.SY (3096) eess.IV (4823) eess.SY (3090) stat.ML (5236)
月別アーカイブ: 2024年2月
Video ReCap: Recursive Captioning of Hour-Long Videos
要約 ほとんどのビデオキャプションモデルは、数秒の短いビデオクリップを処理し、低 … 続きを読む
カテゴリー: cs.CV
Video ReCap: Recursive Captioning of Hour-Long Videos はコメントを受け付けていません
Probabilistic Bayesian optimal experimental design using conditional normalizing flows
要約 ベイズ最適実験計画 (OED) は、予算制約の下で最も有益な実験を実施し、 … 続きを読む
LatentSwap: An Efficient Latent Code Mapping Framework for Face Swapping
要約 私たちは、特定のジェネレーターの顔交換潜在コードを生成する単純な顔交換フレ … 続きを読む
カテゴリー: cs.CV
LatentSwap: An Efficient Latent Code Mapping Framework for Face Swapping はコメントを受け付けていません
Controlling Vision-Language Models for Multi-Task Image Restoration
要約 CLIP などのビジョン言語モデルは、ゼロショットまたはラベルフリー予測の … 続きを読む
カテゴリー: cs.CV
Controlling Vision-Language Models for Multi-Task Image Restoration はコメントを受け付けていません
Objective and Interpretable Breast Cosmesis Evaluation with Attention Guided Denoising Diffusion Anomaly Detection Model
要約 乳がん治療分野の進歩が進むにつれて、患者の生活の質に大きな影響を与えるため … 続きを読む
SegForestNet: Spatial-Partitioning-Based Aerial Image Segmentation
要約 航空画像セグメンテーションは、地図の自動作成や森林伐採の追跡などのアプリケ … 続きを読む
Robust Quantification of Percent Emphysema on CT via Domain Attention: the Multi-Ethnic Study of Atherosclerosis (MESA) Lung Study
要約 コンピューター断層撮影 (CT) による肺気腫の確実な定量化は、さまざまな … 続きを読む
カテゴリー: cs.CV
Robust Quantification of Percent Emphysema on CT via Domain Attention: the Multi-Ethnic Study of Atherosclerosis (MESA) Lung Study はコメントを受け付けていません
Rethinking Centered Kernel Alignment in Knowledge Distillation
要約 知識の蒸留は、大規模モデルと軽量モデルの間の表現の不一致を埋めるための非常 … 続きを読む
カテゴリー: cs.CV
Rethinking Centered Kernel Alignment in Knowledge Distillation はコメントを受け付けていません
A Modular System for Enhanced Robustness of Multimedia Understanding Networks via Deep Parametric Estimation
要約 マルチメディア理解タスクでは、破損したサンプルが機械学習モデルに供給される … 続きを読む
カテゴリー: cs.CV
A Modular System for Enhanced Robustness of Multimedia Understanding Networks via Deep Parametric Estimation はコメントを受け付けていません
A Cognitive Evaluation Benchmark of Image Reasoning and Description for Large Vision Language Models
要約 Large Vision Language Model (LVLM) は、 … 続きを読む