-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Shelf-Supervised Cross-Modal Pre-Training for 3D Object Detection
要約 最先端の 3D オブジェクト検出器は、多くの場合、大量のラベル付きデータセ … 続きを読む
Leveraging Structure Knowledge and Deep Models for the Detection of Abnormal Handwritten Text
要約 現在、手書きテキストのシーケンス構造の破壊が、認識タスクを制限する主なボト … 続きを読む
カテゴリー: cs.CV
Leveraging Structure Knowledge and Deep Models for the Detection of Abnormal Handwritten Text はコメントを受け付けていません
Teaching AI Agents to Search with Reflective-MCTS and Exploratory Learning
要約 自律エージェントは、複雑な複数ステップの意思決定タスクを自動化する上で大き … 続きを読む
Evaluating Image Hallucination in Text-to-Image Generation with Question-Answering
要約 Text-to-Image(TTI)生成モデルは目覚ましい成功を収めている … 続きを読む
SurFhead: Affine Rig Blending for Geometrically Accurate 2D Gaussian Surfel Head Avatars
要約 ガウス プリミティブを使用した頭部アバター レンダリングの最近の進歩により … 続きを読む
Estimating the distribution of numerosity and non-numerical visual magnitudes in natural scenes using computer vision
要約 人間は、多くの動物種と同様に、視覚的なシーン内のオブジェクトの数を認識し、 … 続きを読む
カテゴリー: cs.CV
Estimating the distribution of numerosity and non-numerical visual magnitudes in natural scenes using computer vision はコメントを受け付けていません
A Survey of Low-shot Vision-Language Model Adaptation via Representer Theorem
要約 事前トレーニングされた視覚言語基礎モデルの出現は、ゼロ/少数ショット (つ … 続きを読む
カテゴリー: cs.CV
A Survey of Low-shot Vision-Language Model Adaptation via Representer Theorem はコメントを受け付けていません
Visual Fixation-Based Retinal Prosthetic Simulation
要約 この研究では、サッケード機構にヒントを得て、視覚固視によって駆動される人工 … 続きを読む
Mitigating Backdoor Attack by Injecting Proactive Defensive Backdoor
要約 データポイズニング バックドア攻撃は、機械学習モデルに対する重大なセキュリ … 続きを読む
POPoS: Improving Efficient and Robust Facial Landmark Detection with Parallel Optimal Position Search
要約 顔ランドマーク検出 (FLD) では、精度と効率のバランスを達成することが … 続きを読む
カテゴリー: cs.CV
POPoS: Improving Efficient and Robust Facial Landmark Detection with Parallel Optimal Position Search はコメントを受け付けていません