-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年5月
Self-Supervised Modality-Agnostic Pre-Training of Swin Transformers
要約 教師なし事前トレーニングは変革的なパラダイムとして出現し、さまざまな領域で … 続きを読む
Generalize Polyp Segmentation via Inpainting across Diverse Backgrounds and Pseudo-Mask Refinement
要約 異なる正常な背景内で病変を修復することは、ポリープ セグメンテーション モ … 続きを読む
カテゴリー: cs.CV
Generalize Polyp Segmentation via Inpainting across Diverse Backgrounds and Pseudo-Mask Refinement はコメントを受け付けていません
Anticipating Object State Changes
要約 画像やビデオにおける物体の状態の変化を予測することは困難な問題であり、その … 続きを読む
カテゴリー: cs.CV
Anticipating Object State Changes はコメントを受け付けていません
Adaptive local boundary conditions to improve Deformable Image Registration
要約 目的: 医用画像処理では、多くの場合、画像誘導治療中に動きを正確に評価して … 続きを読む
カテゴリー: cs.CV, physics.med-ph
Adaptive local boundary conditions to improve Deformable Image Registration はコメントを受け付けていません
SARA: Controllable Makeup Transfer with Spatial Alignment and Region-Adaptive Normalization
要約 メイクアップ転送は、ソース画像のアイデンティティを維持しながら、メイクアッ … 続きを読む
カテゴリー: cs.CV
SARA: Controllable Makeup Transfer with Spatial Alignment and Region-Adaptive Normalization はコメントを受け付けていません
DisenStudio: Customized Multi-subject Text-to-Video Generation with Disentangled Spatial Control
要約 最近、ビデオ内でカスタマイズされたコンテンツを生成することがますます注目を … 続きを読む
カテゴリー: cs.CV
DisenStudio: Customized Multi-subject Text-to-Video Generation with Disentangled Spatial Control はコメントを受け付けていません
MOSS: Motion-based 3D Clothed Human Synthesis from Monocular Video
要約 シングルビューの衣服を着た人間の再構成は、特に人間の複雑な動作を伴うコンテ … 続きを読む
カテゴリー: cs.CV
MOSS: Motion-based 3D Clothed Human Synthesis from Monocular Video はコメントを受け付けていません
Talk2Radar: Bridging Natural Language with 4D mmWave Radar for 3D Referring Expression Comprehension
要約 身体的知覚はインテリジェント車両やロボットにとって不可欠であり、より自然な … 続きを読む
Frequency-Adaptive Dilated Convolution for Semantic Segmentation
要約 連続した要素間にギャップを挿入することで受容野を拡張する拡張畳み込みは、コ … 続きを読む
カテゴリー: cs.CV
Frequency-Adaptive Dilated Convolution for Semantic Segmentation はコメントを受け付けていません
A Survey of Deep Learning-based Radiology Report Generation Using Multimodal Data
要約 放射線レポートの自動作成は医師の負担を軽減し、医療リソースの地域格差を最小 … 続きを読む
カテゴリー: cs.CV
A Survey of Deep Learning-based Radiology Report Generation Using Multimodal Data はコメントを受け付けていません