-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年2月
DEFAME: Dynamic Evidence-based FAct-checking with Multimodal Experts
要約 偽情報の拡散は、信頼性が高くスケーラブルな事実確認ソリューションを必要とし … 続きを読む
A Survey of Artificial Intelligence in Gait-Based Neurodegenerative Disease Diagnosis
要約 近年、神経変性疾患(NDS)の影響を受ける世界集団の増加が目撃されました。 … 続きを読む
3D Prior is All You Need: Cross-Task Few-shot 2D Gaze Estimation
要約 3Dおよび2D視線の推定は、眼球運動をキャプチャするという基本的な目的を共 … 続きを読む
カテゴリー: cs.CV
3D Prior is All You Need: Cross-Task Few-shot 2D Gaze Estimation はコメントを受け付けていません
Content-Rich AIGC Video Quality Assessment via Intricate Text Alignment and Motion-Aware Consistency
要約 \ textit {sora}のような次世代のビデオ生成モデルの出現は、A … 続きを読む
カテゴリー: cs.CV
Content-Rich AIGC Video Quality Assessment via Intricate Text Alignment and Motion-Aware Consistency はコメントを受け付けていません
DEALing with Image Reconstruction: Deep Attentive Least Squares
要約 最先端の画像再構成は、多くの場合、複雑で高度にパラメーター化された深いアー … 続きを読む
Recognizing Identities From Human Skeletons: A Survey on 3D Skeleton Based Person Re-Identification
要約 3Dスケルトンを介した人の再識別は、パターン認識コミュニティ内での注目を集 … 続きを読む
Automatic quantification of breast cancer biomarkers from multiple 18F-FDG PET image segmentation
要約 ネオアジュバント化学療法(NAC)は、18F-FDGポジトロン放出断層撮影 … 続きを読む
Efficient Few-Shot Continual Learning in Vision-Language Models
要約 Vision-Language Models(VLM)は、視覚的な質問応答 … 続きを読む
Harmonious Group Choreography with Trajectory-Controllable Diffusion
要約 音楽からグループの振り付けを作成することは、文化的なエンターテイメントと仮 … 続きを読む
カテゴリー: cs.CV
Harmonious Group Choreography with Trajectory-Controllable Diffusion はコメントを受け付けていません
SparseVLM: Visual Token Sparsification for Efficient Vision-Language Model Inference
要約 ビジョン言語モデル(VLMS)では、視覚トークンは通常、テキストトークンと … 続きを読む
カテゴリー: cs.CV
SparseVLM: Visual Token Sparsification for Efficient Vision-Language Model Inference はコメントを受け付けていません