-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Image Synthesis under Limited Data: A Survey and Taxonomy
要約 特定のデータ分布を再現して新しいサンプルを生成することを目的とした深層生成 … 続きを読む
AGFSync: Leveraging AI-Generated Feedback for Preference Optimization in Text-to-Image Generation
要約 Text-to-Image (T2I) 拡散モデルは、画像生成において目覚 … 続きを読む
カテゴリー: cs.CV
AGFSync: Leveraging AI-Generated Feedback for Preference Optimization in Text-to-Image Generation はコメントを受け付けていません
On Explaining Knowledge Distillation: Measuring and Visualising the Knowledge Transfer Process
要約 教師から生徒への知識伝達プロセスの不透明な性質により、知識蒸留 (KD) … 続きを読む
Real Classification by Description: Extending CLIP’s Limits of Part Attributes Recognition
要約 この研究では、説明によるゼロショット「実際の」分類を定義して取り組みます。 … 続きを読む
カテゴリー: cs.CV
Real Classification by Description: Extending CLIP’s Limits of Part Attributes Recognition はコメントを受け付けていません
Cracking the Code of Hallucination in LVLMs with Vision-aware Head Divergence
要約 大規模ビジョン言語モデル (LVLM) は、大規模言語モデル (LLM) … 続きを読む
Benchmarking Pretrained Attention-based Models for Real-Time Recognition in Robot-Assisted Esophagectomy
要約 食道がんは、世界中で最も一般的ながんの種類の 1 つです。 従来、開腹食道 … 続きを読む
CNNtention: Can CNNs do better with Attention?
要約 畳み込みニューラル ネットワーク (CNN) は長い間画像分類タスクの標準 … 続きを読む
Interpreting and Analysing CLIP’s Zero-Shot Image Classification via Mutual Knowledge
要約 Contrastive Language-Image Pretrainin … 続きを読む
カテゴリー: cs.CV
Interpreting and Analysing CLIP’s Zero-Shot Image Classification via Mutual Knowledge はコメントを受け付けていません
GraphAvatar: Compact Head Avatars with GNN-Generated 3D Gaussians
要約 任意の視点からフォトリアリスティックなヘッド アバターをレンダリングするこ … 続きを読む
カテゴリー: cs.CV
GraphAvatar: Compact Head Avatars with GNN-Generated 3D Gaussians はコメントを受け付けていません
Real-Time Position-Aware View Synthesis from Single-View Input
要約 ビュー合成の最近の進歩により、テレプレゼンスやエンターテイメントを含む、さ … 続きを読む