-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Detect an Object At Once without Fine-tuning
要約 これまで見たことのないオブジェクトの 1 枚または数枚の写真が提示されると … 続きを読む
Double Descent Meets Out-of-Distribution Detection: Theoretical Insights and Empirical Analysis on the role of model complexity
要約 過剰パラメータ化は一般化に利益をもたらすことが知られていますが、配信外 ( … 続きを読む
Digi2Real: Bridging the Realism Gap in Synthetic Data Face Recognition via Foundation Models
要約 顔認識システムの精度は、収集された大量のデータとニューラル ネットワーク … 続きを読む
カテゴリー: cs.CV
Digi2Real: Bridging the Realism Gap in Synthetic Data Face Recognition via Foundation Models はコメントを受け付けていません
Fast yet Safe: Early-Exiting with Risk Control
要約 機械学習モデルのスケーリングは、その性能を大幅に向上させる。しかし、このよ … 続きを読む
GSCo: Towards Generalizable AI in Medicine via Generalist-Specialist Collaboration
要約 ジェネラリスト基盤モデル (GFM) は、多様なタスクやモダリティを効果的 … 続きを読む
One VLM to Keep it Learning: Generation and Balancing for Data-free Continual Visual Question Answering
要約 視覚言語モデル (VLM) は、Web スケールのマルチモーダル データセ … 続きを読む
カテゴリー: cs.CV
One VLM to Keep it Learning: Generation and Balancing for Data-free Continual Visual Question Answering はコメントを受け付けていません
SIRA: Scalable Inter-frame Relation and Association for Radar Perception
要約 従来のレーダー特徴抽出は、低い空間分解能、ノイズ、マルチパス反射、ゴースト … 続きを読む
FewViewGS: Gaussian Splatting with Few View Matching and Multi-stage Training
要約 画像からの新規ビュー合成の分野は、ニューラル・ラディアンス・フィールド(N … 続きを読む
カテゴリー: cs.CV
FewViewGS: Gaussian Splatting with Few View Matching and Multi-stage Training はコメントを受け付けていません
3D Audio-Visual Segmentation
要約 シーン中の発音体を認識することは、具現化AIにおける長年の課題であり、ロボ … 続きを読む
SPEAK: Speech-Driven Pose and Emotion-Adjustable Talking Head Generation
要約 しゃべる顔生成に関する先行研究の多くは、唇の動きと発話内容の同期に焦点を当 … 続きを読む