-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
MCL: Multi-view Enhanced Contrastive Learning for Chest X-ray Report Generation
要約 放射線科レポートは、治療戦略を計画し、医師と患者のコミュニケーションを強化 … 続きを読む
A Low-Resolution Image is Worth 1×1 Words: Enabling Fine Image Super-Resolution with Transformers and TaylorShift
要約 トランスベースの超解像度 (SR) モデルは、最近画像再構成の品質を向上さ … 続きを読む
ColorEdit: Training-free Image-Guided Color editing with diffusion model
要約 Text-to-image (T2I) 拡散モデルは、優れた生成機能を備え … 続きを読む
ScribbleVS: Scribble-Supervised Medical Image Segmentation via Dynamic Competitive Pseudo Label Selection
要約 臨床医学では、正確な画像セグメンテーションは臨床医に実質的なサポートを提供 … 続きを読む
カテゴリー: cs.CV
ScribbleVS: Scribble-Supervised Medical Image Segmentation via Dynamic Competitive Pseudo Label Selection はコメントを受け付けていません
DCD: Discriminative and Consistent Representation Distillation
要約 知識蒸留 (KD) は、大規模な教師モデルから小規模な生徒モデルに知識を伝 … 続きを読む
Morpho-Aware Global Attention for Image Matting
要約 ビジョン トランスフォーマー (ViT) と畳み込みニューラル ネットワー … 続きを読む
カテゴリー: cs.CV
Morpho-Aware Global Attention for Image Matting はコメントを受け付けていません
Visual-Linguistic Agent: Towards Collaborative Contextual Object Reasoning
要約 マルチモーダル大規模言語モデル (MLLM) は、画像内の記述タスクには優 … 続きを読む
カテゴリー: cs.CV
Visual-Linguistic Agent: Towards Collaborative Contextual Object Reasoning はコメントを受け付けていません
The Unreasonable Effectiveness of Guidance for Diffusion Models
要約 ガイダンスは、拡散モデルによって生成された画像の知覚品質を向上させるために … 続きを読む
Partial Scene Text Retrieval
要約 部分シーン テキスト取得のタスクには、画像ギャラリーからの特定のクエリ テ … 続きを読む
カテゴリー: cs.CV
Partial Scene Text Retrieval はコメントを受け付けていません
CLCE: An Approach to Refining Cross-Entropy and Contrastive Learning for Optimized Learning Fusion
要約 最先端の事前トレーニング済み画像モデルは、主に 2 段階のアプローチを採用 … 続きを読む