-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年7月
DreamVTON: Customizing 3D Virtual Try-on with Personalized Diffusion Models
要約 画像ベースの 3D 仮想試着 (VTON) は、人物や衣服の画像に従って … 続きを読む
カテゴリー: cs.CV
DreamVTON: Customizing 3D Virtual Try-on with Personalized Diffusion Models はコメントを受け付けていません
Is 3D Convolution with 5D Tensors Really Necessary for Video Analysis?
要約 この論文では、包括的な研究を紹介し、4D および/または 3D テンソルの … 続きを読む
Laplacian Segmentation Networks Improve Epistemic Uncertainty Quantification
要約 画像のセグメンテーションは、特に分布外 (OOD) 画像に対して予測を行う … 続きを読む
Defending Our Privacy With Backdoors
要約 厳選されていない、多くの場合機密性の高い Web スクレイピング データに … 続きを読む
Imperfect Vision Encoders: Efficient and Robust Tuning for Vision-Language Models
要約 ビジョン言語モデル (VLM) は、視覚的な質問応答と画像キャプションの優 … 続きを読む
Position: AI/ML Influencers Have a Place in the Academic Process
要約 AI および ML のカンファレンスで採択された論文の数が数千件に達するに … 続きを読む
A Diffusion Model for Simulation Ready Coronary Anatomy with Morpho-skeletal Control
要約 仮想介入により、冠状動脈内でのデバイス展開の物理ベースのシミュレーションが … 続きを読む
QPT V2: Masked Image Modeling Advances Visual Scoring
要約 品質評価と美的評価は、視覚コンテンツの知覚された品質と美的感覚を評価するこ … 続きを読む
End-to-End Video Question Answering with Frame Scoring Mechanisms and Adaptive Sampling
要約 Video Question Answering (VideoQA) は、 … 続きを読む
MicroEmo: Time-Sensitive Multimodal Emotion Recognition with Micro-Expression Dynamics in Video Dialogues
要約 マルチモーダル大規模言語モデル (MLLM) は、ビデオ内の視覚、音響、言 … 続きを読む