月別アーカイブ: 2025年2月

HiRT: Enhancing Robotic Control with Hierarchical Robot Transformers

要約 事前に学習された強力な視覚言語モデル(VLMs)バックエンドを活用した大規 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | コメントする

OpenAI ChatGPT interprets Radiological Images: GPT-4 as a Medical Doctor for a Fast Check-Up

要約 OpenAIは2022年11月に発表したChatGPTの成功を受けて、20 … 続きを読む

カテゴリー: cs.CV | コメントする

Unsupervised Domain Adaptation via Style-Aware Self-intermediate Domain

要約 教師なしドメイン適応(UDA)は、ラベルが豊富なソースドメインから、関連す … 続きを読む

カテゴリー: 68T07, cs.AI, cs.CV, I.2.m | コメントする

Investigating the Quality of DermaMNIST and Fitzpatrick17k Dermatological Image Datasets

要約 皮膚科学タスクにおけるディープラーニングの目覚ましい進歩により、人間の専門 … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Unforgettable Lessons from Forgettable Images: Intra-Class Memorability Matters in Computer Vision Tasks

要約 我々はクラス内記憶可能性を導入する。クラス内記憶可能性とは、同じクラス内の … 続きを読む

カテゴリー: cs.CV | コメントする

Style-based Clustering of Visual Artworks and the Play of Neural Style-Representations

要約 スタイルに基づく芸術作品のクラスタリングは、芸術作品の推薦、スタイルに基づ … 続きを読む

カテゴリー: cs.CV, cs.LG, I.4.8 | コメントする

Detection, Retrieval, and Explanation Unified: A Violence Detection System Based on Knowledge Graphs and GAT

要約 近年、統一されたマルチモーダルモデルを用いて開発された暴力検知システムが大 … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

Multimodal ELBO with Diffusion Decoders

要約 マルチモーダル変分オートエンコーダは、異なるモダリティを潜在表現にマッピン … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Discovering Hidden Visual Concepts Beyond Linguistic Input in Infant Learning

要約 乳幼児は、言語入力の習得に先立ち、複雑な視覚的理解を急速に発達させる。コン … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

Warfare:Breaking the Watermark Protection of AI-Generated Content

要約 AI生成コンテンツ(AIGC)は急速に拡大しており、高度な生成モデルを用い … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする