月別アーカイブ: 2023年8月

VALERIE22 — A photorealistic, richly metadata annotated dataset of urban environments

要約 VALERIE ツール パイプラインは、DNN (ディープ ニューラル ネ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | VALERIE22 — A photorealistic, richly metadata annotated dataset of urban environments はコメントを受け付けていません

Revisiting Skin Tone Fairness in Dermatological Lesion Classification

要約 皮膚疾患は肌の色調によってどのように発現するかが異なるため、皮膚科学画像か … 続きを読む

カテゴリー: cs.CV, cs.CY, cs.LG, eess.IV | Revisiting Skin Tone Fairness in Dermatological Lesion Classification はコメントを受け付けていません

Remote Bio-Sensing: Open Source Benchmark Framework for Fair Evaluation of rPPG

要約 rPPG(Remote photoplethysmography)は、カメ … 続きを読む

カテゴリー: 68T07, 68T45, cs.AI, cs.CV, cs.LG, eess.IV, eess.SP, I.2 | Remote Bio-Sensing: Open Source Benchmark Framework for Fair Evaluation of rPPG はコメントを受け付けていません

Tree-of-Mixed-Thought: Combining Fast and Slow Thinking for Multi-hop Visual Reasoning

要約 大規模言語モデル (LLM) を使用して、視覚的推論などの複雑な推論タスク … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Tree-of-Mixed-Thought: Combining Fast and Slow Thinking for Multi-hop Visual Reasoning はコメントを受け付けていません

KeyPosS: Plug-and-Play Facial Landmark Detection through GPS-Inspired True-Range Multilateration

要約 顔分析の分野では、顔認識や表情分析からアニメーションに至るまで、さまざまな … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | KeyPosS: Plug-and-Play Facial Landmark Detection through GPS-Inspired True-Range Multilateration はコメントを受け付けていません

PoSynDA: Multi-Hypothesis Pose Synthesis Domain Adaptation for Robust 3D Human Pose Estimation

要約 現在の 3D 人間の姿勢推定器は、ターゲット ドメインのトレーニング セッ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, cs.RO | PoSynDA: Multi-Hypothesis Pose Synthesis Domain Adaptation for Robust 3D Human Pose Estimation はコメントを受け付けていません

Fairness Continual Learning Approach to Semantic Scene Understanding in Open-World Environments

要約 継続的なセマンティック セグメンテーションは、以前のクラスの情報を維持しな … 続きを読む

カテゴリー: cs.CV | Fairness Continual Learning Approach to Semantic Scene Understanding in Open-World Environments はコメントを受け付けていません

ELITE: Encoding Visual Concepts into Textual Embeddings for Customized Text-to-Image Generation

要約 想像上の創造における前例のない能力に加えて、大規模なテキストから画像へのモ … 続きを読む

カテゴリー: cs.CV | ELITE: Encoding Visual Concepts into Textual Embeddings for Customized Text-to-Image Generation はコメントを受け付けていません

Audiovisual Moments in Time: A Large-Scale Annotated Dataset of Audiovisual Actions

要約 私たちは、オーディオビジュアル アクション イベントの大規模なデータセット … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | Audiovisual Moments in Time: A Large-Scale Annotated Dataset of Audiovisual Actions はコメントを受け付けていません

DarSwin: Distortion Aware Radial Swin Transformer

要約 広角レンズは、広い視野を必要とする認識作業によく使用されます。 残念ながら … 続きを読む

カテゴリー: 68T01, cs.CV | DarSwin: Distortion Aware Radial Swin Transformer はコメントを受け付けていません