cs.CV」カテゴリーアーカイブ

Detect an Object At Once without Fine-tuning

要約 これまで見たことのないオブジェクトの 1 枚または数枚の写真が提示されると … 続きを読む

カテゴリー: cs.AI, cs.CV | Detect an Object At Once without Fine-tuning はコメントを受け付けていません

Double Descent Meets Out-of-Distribution Detection: Theoretical Insights and Empirical Analysis on the role of model complexity

要約 過剰パラメータ化は一般化に利益をもたらすことが知られていますが、配信外 ( … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, math.ST, stat.ML, stat.TH | Double Descent Meets Out-of-Distribution Detection: Theoretical Insights and Empirical Analysis on the role of model complexity はコメントを受け付けていません

Digi2Real: Bridging the Realism Gap in Synthetic Data Face Recognition via Foundation Models

要約 顔認識システムの精度は、収集された大量のデータとニューラル ネットワーク … 続きを読む

カテゴリー: cs.CV | Digi2Real: Bridging the Realism Gap in Synthetic Data Face Recognition via Foundation Models はコメントを受け付けていません

Fast yet Safe: Early-Exiting with Risk Control

要約 機械学習モデルのスケーリングは、その性能を大幅に向上させる。しかし、このよ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | Fast yet Safe: Early-Exiting with Risk Control はコメントを受け付けていません

GSCo: Towards Generalizable AI in Medicine via Generalist-Specialist Collaboration

要約 ジェネラリスト基盤モデル (GFM) は、多様なタスクやモダリティを効果的 … 続きを読む

カテゴリー: cs.CL, cs.CV | GSCo: Towards Generalizable AI in Medicine via Generalist-Specialist Collaboration はコメントを受け付けていません

One VLM to Keep it Learning: Generation and Balancing for Data-free Continual Visual Question Answering

要約 視覚言語モデル (VLM) は、Web スケールのマルチモーダル データセ … 続きを読む

カテゴリー: cs.CV | One VLM to Keep it Learning: Generation and Balancing for Data-free Continual Visual Question Answering はコメントを受け付けていません

SIRA: Scalable Inter-frame Relation and Association for Radar Perception

要約 従来のレーダー特徴抽出は、低い空間分解能、ノイズ、マルチパス反射、ゴースト … 続きを読む

カテゴリー: cs.CV, cs.LG | SIRA: Scalable Inter-frame Relation and Association for Radar Perception はコメントを受け付けていません

FewViewGS: Gaussian Splatting with Few View Matching and Multi-stage Training

要約 画像からの新規ビュー合成の分野は、ニューラル・ラディアンス・フィールド(N … 続きを読む

カテゴリー: cs.CV | FewViewGS: Gaussian Splatting with Few View Matching and Multi-stage Training はコメントを受け付けていません

3D Audio-Visual Segmentation

要約 シーン中の発音体を認識することは、具現化AIにおける長年の課題であり、ロボ … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | 3D Audio-Visual Segmentation はコメントを受け付けていません

SPEAK: Speech-Driven Pose and Emotion-Adjustable Talking Head Generation

要約 しゃべる顔生成に関する先行研究の多くは、唇の動きと発話内容の同期に焦点を当 … 続きを読む

カテゴリー: cs.CV, I.4.5 | SPEAK: Speech-Driven Pose and Emotion-Adjustable Talking Head Generation はコメントを受け付けていません