-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2023年2月
DirectMHP: Direct 2D Multi-Person Head Pose Estimation with Full-range Angles
要約 既存の頭部姿勢推定 (HPE) は主に、前頭頭が事前に検出された 1 人の … 続きを読む
カテゴリー: cs.CV
DirectMHP: Direct 2D Multi-Person Head Pose Estimation with Full-range Angles はコメントを受け付けていません
Does CLIP Know My Face?
要約 さまざまなアプリケーションでの深層学習の台頭に伴い、トレーニング データの … 続きを読む
Understanding and Mitigating Overfitting in Prompt Tuning for Vision-Language Models
要約 CLIP などの事前トレーニング済みのビジョン言語モデル (VLM) は、 … 続きを読む
カテゴリー: cs.CV
Understanding and Mitigating Overfitting in Prompt Tuning for Vision-Language Models はコメントを受け付けていません
What do CNNs Learn in the First Layer and Why? A Linear Systems Perspective
要約 深い畳み込みニューラル ネットワーク (CNN) の最初の層で学習される表 … 続きを読む
カテゴリー: cs.CV
What do CNNs Learn in the First Layer and Why? A Linear Systems Perspective はコメントを受け付けていません
Team-DETR: Guide Queries as a Professional Team in Detection Transformers
要約 最近提案された DETR バリアントは、合理化されたプロセスと優れたパフォ … 続きを読む
カテゴリー: cs.CV
Team-DETR: Guide Queries as a Professional Team in Detection Transformers はコメントを受け付けていません
Universal Guidance for Diffusion Models
要約 典型的な拡散モデルは、特定の形式の条件付け (最も一般的にはテキスト) を … 続きを読む
All in Tokens: Unifying Output Space of Visual Tasks via Soft Token
要約 通常、出力空間が一連のトークンに限定される言語タスクとは異なり、視覚タスク … 続きを読む
A Comprehensive Study of Real-Time Object Detection Networks Across Multiple Domains: A Survey
要約 ディープ ニューラル ネットワーク ベースのオブジェクト検出器は継続的に進 … 続きを読む
Expressive Talking Head Video Encoding in StyleGAN2 Latent-Space
要約 ビデオの再現に関する研究の最近の進歩は有望な結果をもたらしましたが、そのア … 続きを読む
カテゴリー: cs.CV
Expressive Talking Head Video Encoding in StyleGAN2 Latent-Space はコメントを受け付けていません
Extracting Effective Subnetworks with Gumbel-Softmax
要約 大規模でパフォーマンスの高いニューラル ネットワークは、多くの場合、パラメ … 続きを読む
カテゴリー: cs.CV
Extracting Effective Subnetworks with Gumbel-Softmax はコメントを受け付けていません