cs.CV」カテゴリーアーカイブ

Human-AI Collaborative Multi-modal Multi-rater Learning for Endometriosis Diagnosis

要約 子宮内膜症は、出生時に女性として割り当てられた人の約 10% に罹患してお … 続きを読む

カテゴリー: cs.CV | Human-AI Collaborative Multi-modal Multi-rater Learning for Endometriosis Diagnosis はコメントを受け付けていません

LFME: A Simple Framework for Learning from Multiple Experts in Domain Generalization

要約 ドメイン一般化 (DG) 手法は、複数のソース ドメインからのトレーニング … 続きを読む

カテゴリー: cs.CV, cs.LG | LFME: A Simple Framework for Learning from Multiple Experts in Domain Generalization はコメントを受け付けていません

Bootstrapping Reinforcement Learning with Imitation for Vision-Based Agile Flight

要約 アジャイルクワッドローター飛行のための視覚運動ポリシーの学習には、主に高次 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Bootstrapping Reinforcement Learning with Imitation for Vision-Based Agile Flight はコメントを受け付けていません

Peter Parker or Spiderman? Disambiguating Multiple Class Labels

要約 教師あり分類設定では、推論中にディープ ネットワークが通常、複数の予測を行 … 続きを読む

カテゴリー: cs.AI, cs.CV | Peter Parker or Spiderman? Disambiguating Multiple Class Labels はコメントを受け付けていません

GABInsight: Exploring Gender-Activity Binding Bias in Vision-Language Models

要約 視覚言語モデル (VLM) は、画像に映る個人の評価を必要とするタスクなど … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | GABInsight: Exploring Gender-Activity Binding Bias in Vision-Language Models はコメントを受け付けていません

AttentionPainter: An Efficient and Adaptive Stroke Predictor for Scene Painting

要約 ストロークベース レンダリング (SBR) は、入力イメージをパラメータ化 … 続きを読む

カテゴリー: cs.CV | AttentionPainter: An Efficient and Adaptive Stroke Predictor for Scene Painting はコメントを受け付けていません

Content-Aware Radiance Fields: Aligning Model Complexity with Scene Intricacy Through Learned Bitwidth Quantization

要約 Neural Radiance Fields (NeRF)、Instant … 続きを読む

カテゴリー: cs.CV, eess.IV | Content-Aware Radiance Fields: Aligning Model Complexity with Scene Intricacy Through Learned Bitwidth Quantization はコメントを受け付けていません

x-RAGE: eXtended Reality — Action & Gesture Events Dataset

要約 メタバースの出現と近年のウェアラブル デバイスへの注目により、ジェスチャ … 続きを読む

カテゴリー: cs.CV, cs.ET | x-RAGE: eXtended Reality — Action & Gesture Events Dataset はコメントを受け付けていません

MM-WLAuslan: Multi-View Multi-Modal Word-Level Australian Sign Language Recognition Dataset

要約 分離手話認識 (ISLR) は、個々の手話の光沢を識別することに重点を置い … 続きを読む

カテゴリー: cs.CV | MM-WLAuslan: Multi-View Multi-Modal Word-Level Australian Sign Language Recognition Dataset はコメントを受け付けていません

Conditional Hallucinations for Image Compression

要約 非可逆画像圧縮では、モデルは、情報のボトルネックにより、細部が幻覚になった … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Conditional Hallucinations for Image Compression はコメントを受け付けていません