-
最近の投稿
- DINO-WM: World Models on Pre-trained Visual Features enable Zero-shot Planning
- Coarse-to-fine Q-Network with Action Sequence for Data-Efficient Robot Learning
- SeePerSea: Multi-modal Perception Dataset of In-water Objects for Autonomous Surface Vehicles
- FastUMI: A Scalable and Hardware-Independent Universal Manipulation Interface with Dataset
- Gaze-based Task Decomposition for Robot Manipulation in Imitation Learning
-
最近のコメント
表示できるコメントはありません。 cs.AI (33149) cs.CL (25043) cs.CR (2564) cs.CV (39236) cs.LG (38060) cs.RO (19259) cs.SY (2948) eess.IV (4699) eess.SY (2942) stat.ML (5009)
月別アーカイブ: 2025年2月
HiRT: Enhancing Robotic Control with Hierarchical Robot Transformers
要約 事前に学習された強力な視覚言語モデル(VLMs)バックエンドを活用した大規 … 続きを読む
OpenAI ChatGPT interprets Radiological Images: GPT-4 as a Medical Doctor for a Fast Check-Up
要約 OpenAIは2022年11月に発表したChatGPTの成功を受けて、20 … 続きを読む
Unsupervised Domain Adaptation via Style-Aware Self-intermediate Domain
要約 教師なしドメイン適応(UDA)は、ラベルが豊富なソースドメインから、関連す … 続きを読む
Investigating the Quality of DermaMNIST and Fitzpatrick17k Dermatological Image Datasets
要約 皮膚科学タスクにおけるディープラーニングの目覚ましい進歩により、人間の専門 … 続きを読む
Unforgettable Lessons from Forgettable Images: Intra-Class Memorability Matters in Computer Vision Tasks
要約 我々はクラス内記憶可能性を導入する。クラス内記憶可能性とは、同じクラス内の … 続きを読む
Style-based Clustering of Visual Artworks and the Play of Neural Style-Representations
要約 スタイルに基づく芸術作品のクラスタリングは、芸術作品の推薦、スタイルに基づ … 続きを読む
Detection, Retrieval, and Explanation Unified: A Violence Detection System Based on Knowledge Graphs and GAT
要約 近年、統一されたマルチモーダルモデルを用いて開発された暴力検知システムが大 … 続きを読む
Multimodal ELBO with Diffusion Decoders
要約 マルチモーダル変分オートエンコーダは、異なるモダリティを潜在表現にマッピン … 続きを読む
Discovering Hidden Visual Concepts Beyond Linguistic Input in Infant Learning
要約 乳幼児は、言語入力の習得に先立ち、複雑な視覚的理解を急速に発達させる。コン … 続きを読む
Warfare:Breaking the Watermark Protection of AI-Generated Content
要約 AI生成コンテンツ(AIGC)は急速に拡大しており、高度な生成モデルを用い … 続きを読む