-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Human-AI Collaborative Multi-modal Multi-rater Learning for Endometriosis Diagnosis
要約 子宮内膜症は、出生時に女性として割り当てられた人の約 10% に罹患してお … 続きを読む
カテゴリー: cs.CV
Human-AI Collaborative Multi-modal Multi-rater Learning for Endometriosis Diagnosis はコメントを受け付けていません
LFME: A Simple Framework for Learning from Multiple Experts in Domain Generalization
要約 ドメイン一般化 (DG) 手法は、複数のソース ドメインからのトレーニング … 続きを読む
Bootstrapping Reinforcement Learning with Imitation for Vision-Based Agile Flight
要約 アジャイルクワッドローター飛行のための視覚運動ポリシーの学習には、主に高次 … 続きを読む
Peter Parker or Spiderman? Disambiguating Multiple Class Labels
要約 教師あり分類設定では、推論中にディープ ネットワークが通常、複数の予測を行 … 続きを読む
GABInsight: Exploring Gender-Activity Binding Bias in Vision-Language Models
要約 視覚言語モデル (VLM) は、画像に映る個人の評価を必要とするタスクなど … 続きを読む
AttentionPainter: An Efficient and Adaptive Stroke Predictor for Scene Painting
要約 ストロークベース レンダリング (SBR) は、入力イメージをパラメータ化 … 続きを読む
カテゴリー: cs.CV
AttentionPainter: An Efficient and Adaptive Stroke Predictor for Scene Painting はコメントを受け付けていません
Content-Aware Radiance Fields: Aligning Model Complexity with Scene Intricacy Through Learned Bitwidth Quantization
要約 Neural Radiance Fields (NeRF)、Instant … 続きを読む
x-RAGE: eXtended Reality — Action & Gesture Events Dataset
要約 メタバースの出現と近年のウェアラブル デバイスへの注目により、ジェスチャ … 続きを読む
MM-WLAuslan: Multi-View Multi-Modal Word-Level Australian Sign Language Recognition Dataset
要約 分離手話認識 (ISLR) は、個々の手話の光沢を識別することに重点を置い … 続きを読む
カテゴリー: cs.CV
MM-WLAuslan: Multi-View Multi-Modal Word-Level Australian Sign Language Recognition Dataset はコメントを受け付けていません
Conditional Hallucinations for Image Compression
要約 非可逆画像圧縮では、モデルは、情報のボトルネックにより、細部が幻覚になった … 続きを読む