-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Deep Representation Learning for Unsupervised Clustering of Myocardial Fiber Trajectories in Cardiac Diffusion Tensor Imaging
要約 複雑な心筋アーキテクチャを理解することは、心臓病の診断と治療に不可欠です。 … 続きを読む
Visual Imitation Enables Contextual Humanoid Control
要約 ヒューマノイドに階段を登り、周囲の環境のコンテキストを使用して椅子に座るよ … 続きを読む
VideoUFO: A Million-Scale User-Focused Dataset for Text-to-Video Generation
要約 テキストからビデオへの生成モデルは、テキストプロンプトを動的な視覚コンテン … 続きを読む
カテゴリー: cs.CV
VideoUFO: A Million-Scale User-Focused Dataset for Text-to-Video Generation はコメントを受け付けていません
Advancing Food Nutrition Estimation via Visual-Ingredient Feature Fusion
要約 栄養推定は、健康的な食事を促進し、食事関連の健康リスクを軽減する重要な要素 … 続きを読む
Aya Vision: Advancing the Frontier of Multilingual Multimodality
要約 マルチモーダル言語モデルの構築は根本的に困難です。ビジョンと言語のモダリテ … 続きを読む
Towards Autonomous UAV Visual Object Search in City Space: Benchmark and Agentic Methodology
要約 都市環境での航空視覚オブジェクト検索(AVOS)タスクでは、外部ガイダンス … 続きを読む
HarmoniCa: Harmonizing Training and Inference for Better Feature Caching in Diffusion Transformer Acceleration
要約 拡散変圧器(DIT)は生成タスクに優れていますが、推論コストが高いため、実 … 続きを読む
カテゴリー: cs.CV
HarmoniCa: Harmonizing Training and Inference for Better Feature Caching in Diffusion Transformer Acceleration はコメントを受け付けていません
Breast Cancer Histopathology Classification using CBAM-EfficientNetV2 with Transfer Learning
要約 乳がんの組織病理学の画像分類は、早期発見と患者の転帰の改善に重要です。 1 … 続きを読む
Efficient Adaptation For Remote Sensing Visual Grounding
要約 事前に訓練されたモデルの適応は、人工知能における効果的な戦略となっており、 … 続きを読む
UniSkill: Imitating Human Videos via Cross-Embodiment Skill Representations
要約 模倣は人間の基本的な学習メカニズムであり、個人が専門家を観察し模倣すること … 続きを読む