cs.CV」カテゴリーアーカイブ

Adversarial Score identity Distillation: Rapidly Surpassing the Teacher in One Step

要約 スコアアイデンティティ蒸留 (SiD) は、トレーニング データを必要とせ … 続きを読む

カテゴリー: cs.CV, cs.LG | Adversarial Score identity Distillation: Rapidly Surpassing the Teacher in One Step はコメントを受け付けていません

Nearest Neighbor Normalization Improves Multimodal Retrieval

要約 マルチモーダル モデルは、大規模な事前トレーニングを利用して、画像キャプシ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Nearest Neighbor Normalization Improves Multimodal Retrieval はコメントを受け付けていません

AIDOVECL: AI-generated Dataset of Outpainted Vehicles for Eye-level Classification and Localization

要約 画像のラベル付けは、コンピューター ビジョン テクノロジの開発における重大 … 続きを読む

カテゴリー: 68T01, 68T45, 68U01, 68U10, cs.AI, cs.CV, cs.LG, I.2.10 | AIDOVECL: AI-generated Dataset of Outpainted Vehicles for Eye-level Classification and Localization はコメントを受け付けていません

Text-Aware Diffusion for Policy Learning

要約 特定の目標を達成したり、望ましい動作を実行したりするためのエージェントのト … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Text-Aware Diffusion for Policy Learning はコメントを受け付けていません

De-Confusing Pseudo-Labels in Source-Free Domain Adaptation

要約 ソースフリー ドメイン適応は、ソース データにアクセスせずに、ソースでトレ … 続きを読む

カテゴリー: cs.CV | De-Confusing Pseudo-Labels in Source-Free Domain Adaptation はコメントを受け付けていません

Learning Cooperative Trajectory Representations for Motion Forecasting

要約 動きの予測は自動運転にとって不可欠なタスクであり、インフラや他の車両からの … 続きを読む

カテゴリー: cs.CV | Learning Cooperative Trajectory Representations for Motion Forecasting はコメントを受け付けていません

COSNet: A Novel Semantic Segmentation Network using Enhanced Boundaries in Cluttered Scenes

要約 自動廃棄物リサイクルは、ビジョンベースのシステムを採用することで、廃棄物か … 続きを読む

カテゴリー: cs.CV | COSNet: A Novel Semantic Segmentation Network using Enhanced Boundaries in Cluttered Scenes はコメントを受け付けていません

HoloChrome: Polychromatic Illumination for Speckle Reduction in Holographic Near-Eye Displays

要約 ホログラフィック ディスプレイは、本物の奥行きの手掛かりを提供する可能性を … 続きを読む

カテゴリー: cs.CV, cs.GR, eess.IV, eess.SP, physics.optics | HoloChrome: Polychromatic Illumination for Speckle Reduction in Holographic Near-Eye Displays はコメントを受け付けていません

Exploring Vision Language Models for Facial Attribute Recognition: Emotion, Race, Gender, and Age

要約 人種、性別、年齢、感情などの顔の属性を認識するテクノロジーには、監視、広告 … 続きを読む

カテゴリー: cs.CV | Exploring Vision Language Models for Facial Attribute Recognition: Emotion, Race, Gender, and Age はコメントを受け付けていません

Scaling Concept With Text-Guided Diffusion Models

要約 テキスト誘導拡散モデルは、テキストの説明から忠実度の高いコンテンツを生成す … 続きを読む

カテゴリー: cs.CL, cs.CV | Scaling Concept With Text-Guided Diffusion Models はコメントを受け付けていません