-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
VideoUFO: A Million-Scale User-Focused Dataset for Text-to-Video Generation
要約 テキストからビデオへの生成モデルは、テキストプロンプトを動的な視覚コンテン … 続きを読む
カテゴリー: cs.CV
VideoUFO: A Million-Scale User-Focused Dataset for Text-to-Video Generation はコメントを受け付けていません
Advancing Food Nutrition Estimation via Visual-Ingredient Feature Fusion
要約 栄養推定は、健康的な食事を促進し、食事関連の健康リスクを軽減する重要な要素 … 続きを読む
Aya Vision: Advancing the Frontier of Multilingual Multimodality
要約 マルチモーダル言語モデルの構築は根本的に困難です。ビジョンと言語のモダリテ … 続きを読む
Towards Autonomous UAV Visual Object Search in City Space: Benchmark and Agentic Methodology
要約 都市環境での航空視覚オブジェクト検索(AVOS)タスクでは、外部ガイダンス … 続きを読む
HarmoniCa: Harmonizing Training and Inference for Better Feature Caching in Diffusion Transformer Acceleration
要約 拡散変圧器(DIT)は生成タスクに優れていますが、推論コストが高いため、実 … 続きを読む
カテゴリー: cs.CV
HarmoniCa: Harmonizing Training and Inference for Better Feature Caching in Diffusion Transformer Acceleration はコメントを受け付けていません
Breast Cancer Histopathology Classification using CBAM-EfficientNetV2 with Transfer Learning
要約 乳がんの組織病理学の画像分類は、早期発見と患者の転帰の改善に重要です。 1 … 続きを読む
Efficient Adaptation For Remote Sensing Visual Grounding
要約 事前に訓練されたモデルの適応は、人工知能における効果的な戦略となっており、 … 続きを読む
UniSkill: Imitating Human Videos via Cross-Embodiment Skill Representations
要約 模倣は人間の基本的な学習メカニズムであり、個人が専門家を観察し模倣すること … 続きを読む
GP-GS: Gaussian Processes for Enhanced Gaussian Splatting
要約 3Dガウスのスプラッティングは、効率的なフォトリアリスティックな新規ビュー … 続きを読む
FLUXSynID: A Framework for Identity-Controlled Synthetic Face Generation with Document and Live Images
要約 合成フェイスデータセットは、プライバシーの懸念、人口統計の不均衡、高い収集 … 続きを読む
カテゴリー: cs.CV
FLUXSynID: A Framework for Identity-Controlled Synthetic Face Generation with Document and Live Images はコメントを受け付けていません