-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Rad4XCNN: a new agnostic method for post-hoc global explanation of CNN-derived features by means of radiomics
要約 近年、機械学習ベースの臨床意思決定支援システム (CDSS) が、いくつか … 続きを読む
Motion-Zero: Zero-Shot Moving Object Control Framework for Diffusion-Based Video Generation
要約 最近の大規模な事前トレーニング済み拡散モデルは、詳細なテキストの説明から高 … 続きを読む
カテゴリー: cs.CV
Motion-Zero: Zero-Shot Moving Object Control Framework for Diffusion-Based Video Generation はコメントを受け付けていません
OpenOmni: Large Language Models Pivot Zero-shot Omnimodal Alignment across Language with Real-time Self-Aware Emotional Speech Synthesis
要約 オムニモーダル学習の最近の進歩は、主に独自のモデル内ではあるものの、画像、 … 続きを読む
Learnable Scaled Gradient Descent for Guaranteed Robust Tensor PCA
要約 ロバストテンソル主成分分析 (RTPCA) は、多次元データから低ランク成 … 続きを読む
カテゴリー: cs.CV
Learnable Scaled Gradient Descent for Guaranteed Robust Tensor PCA はコメントを受け付けていません
Supervision-free Vision-Language Alignment
要約 視覚言語モデル (VLM) は、視覚情報と言語情報の統合において顕著な可能 … 続きを読む
PointDreamer: Zero-shot 3D Textured Mesh Reconstruction from Colored Point Cloud
要約 カラー点群からテクスチャ メッシュを再構築することは重要ですが、困難な作業 … 続きを読む
カテゴリー: cs.CV
PointDreamer: Zero-shot 3D Textured Mesh Reconstruction from Colored Point Cloud はコメントを受け付けていません
Unified Coding for Both Human Perception and Generalized Machine Analytics with CLIP Supervision
要約 デコードされたビットストリームは通常、人間またはマシンのニーズにのみ対応し … 続きを読む
Towards Revisiting Visual Place Recognition for Joining Submaps in Multimap SLAM
要約 Visual SLAM は、多くの自律システムにとって重要なテクノロジーで … 続きを読む
Boosting Salient Object Detection with Knowledge Distillated from Large Foundation Models
要約 Salient Object Detection (SOD) は、シーン内 … 続きを読む
カテゴリー: cs.CV
Boosting Salient Object Detection with Knowledge Distillated from Large Foundation Models はコメントを受け付けていません
Identity-Preserving Video Dubbing Using Motion Warping
要約 ビデオダビングは、リファレンスビデオと運転音声信号からリアルなリップシンク … 続きを読む
カテゴリー: cs.CV
Identity-Preserving Video Dubbing Using Motion Warping はコメントを受け付けていません