-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年2月
Dimitra: Audio-driven Diffusion model for Expressive Talking Head Generation
要約 オーディオ駆動のトーキングヘッド生成のための新しいフレームワークであるディ … 続きを読む
カテゴリー: cs.CV
Dimitra: Audio-driven Diffusion model for Expressive Talking Head Generation はコメントを受け付けていません
Modeling Multi-modal Cross-interaction for Multi-label Few-shot Image Classification Based on Local Feature Selection
要約 マルチラベル少数のショット画像分類(ML-FSIC)の目的は、各ラベルに少 … 続きを読む
カテゴリー: cs.CV
Modeling Multi-modal Cross-interaction for Multi-label Few-shot Image Classification Based on Local Feature Selection はコメントを受け付けていません
Motion-Robust T2* Quantification from Gradient Echo MRI with Physics-Informed Deep Learning
要約 目的:勾配エコーからのT2*の定量化磁気共鳴画像法は、運動の影響を受け、信 … 続きを読む
カテゴリー: cs.CV, cs.LG, eess.IV, physics.med-ph
Motion-Robust T2* Quantification from Gradient Echo MRI with Physics-Informed Deep Learning はコメントを受け付けていません
A Two-step Linear Mixing Model for Unmixing under Hyperspectral Variability
要約 スペクトルアンミキシングは、ハイパースペクトル画像処理の研究分野で重要なタ … 続きを読む
ELFS: Label-Free Coreset Selection with Proxy Training Dynamics
要約 高品質のヒトが注目したデータは、最新の深い学習パイプラインにとって重要です … 続きを読む
Cross-Attention Head Position Patterns Can Align with Human Visual Concepts in Text-to-Image Generative Models
要約 最近のテキスト間拡散モデルは、視覚的な生成タスクの範囲を強化するために効果 … 続きを読む
X Modality Assisting RGBT Object Tracking
要約 堅牢なマルチモーダル機能表現の開発は、オブジェクト追跡パフォーマンスを強化 … 続きを読む
カテゴリー: cs.CV
X Modality Assisting RGBT Object Tracking はコメントを受け付けていません
Tidiness Score-Guided Monte Carlo Tree Search for Visual Tabletop Rearrangement
要約 このホワイトペーパーでは、RGB-Dカメラのみを使用してテーブルトップの片 … 続きを読む
MegaLoc: One Retrieval to Place Them All
要約 特定のクエリと同じ場所から画像を取得することは、視覚的な場所認識、ランドマ … 続きを読む
カテゴリー: cs.CV
MegaLoc: One Retrieval to Place Them All はコメントを受け付けていません
Bringing NeRFs to the Latent Space: Inverse Graphics Autoencoder
要約 事前に訓練された画像自動エンコーダーは、コンピュータービジョンでますます利 … 続きを読む
カテゴリー: cs.CV
Bringing NeRFs to the Latent Space: Inverse Graphics Autoencoder はコメントを受け付けていません