-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年5月
Xmodel-VLM: A Simple Baseline for Multimodal Vision Language Model
要約 最先端のマルチモーダル ビジョン言語モデルである Xmodel-VLM を … 続きを読む
Wild Berry image dataset collected in Finnish forests and peatlands using drones
要約 ベリー狩りはフィンランドに長年の伝統がありますが、挑戦的で潜在的に危険な場 … 続きを読む
カテゴリー: cs.CV
Wild Berry image dataset collected in Finnish forests and peatlands using drones はコメントを受け付けていません
3D Diffusion Policy: Generalizable Visuomotor Policy Learning via Simple 3D Representations
要約 模倣学習はロボットに器用なスキルを教える効率的な方法を提供します。 ただし … 続きを読む
Graph Neural Network based Handwritten Trajectories Recognition
要約 グラフ ニューラル ネットワークは、現実のアプリケーションにおいて効率的な … 続きを読む
RaffeSDG: Random Frequency Filtering enabled Single-source Domain Generalization for Medical Image Segmentation
要約 ディープ ラーニング モデルは、ソース データとターゲット データの間でド … 続きを読む
カテゴリー: cs.CV
RaffeSDG: Random Frequency Filtering enabled Single-source Domain Generalization for Medical Image Segmentation はコメントを受け付けていません
Similarity Metrics for MR Image-To-Image Translation
要約 画像間の変換は、医療画像処理に大きな影響を与える可能性があります。つまり、 … 続きを読む
Dance Any Beat: Blending Beats with Visuals in Dance Video Generation
要約 音楽からダンスを生成するというタスクは重要ですが、主に関節シーケンスを生成 … 続きを読む
MVBIND: Self-Supervised Music Recommendation For Videos Via Embedding Space Binding
要約 近年、通常、ビジュアルとオーディオの両方のモダリティを含むショートビデオが … 続きを読む
DeCoDEx: Confounder Detector Guidance for Improved Diffusion-based Counterfactual Explanations
要約 ディープ ラーニング分類器は、ターゲット クラスに関連付けられた因果マーカ … 続きを読む
カテゴリー: cs.CV
DeCoDEx: Confounder Detector Guidance for Improved Diffusion-based Counterfactual Explanations はコメントを受け付けていません
LRVS-Fashion: Extending Visual Search with Referring Instructions
要約 この論文では、ファッションの文脈における画像類似性検索の新たな課題を紹介し … 続きを読む