-
最近の投稿
- Towards Generalizable Vision-Language Robotic Manipulation: A Benchmark and LLM-guided 3D Policy
- Haptic-ACT: Bridging Human Intuition with Compliant Robotic Manipulation via Immersive VR
- Task-Aware Robotic Grasping by evaluating Quality Diversity Solutions through Foundation Models
- VDT-Auto: End-to-end Autonomous Driving with VLM-Guided Diffusion Transformers
- ViViDex: Learning Vision-based Dexterous Manipulation from Human Videos
-
最近のコメント
表示できるコメントはありません。 cs.AI (34550) cs.CL (26107) cs.CR (2648) cs.CV (40394) cs.LG (39550) cs.RO (20191) cs.SY (3066) eess.IV (4803) eess.SY (3060) stat.ML (5206)
月別アーカイブ: 2024年7月
SynthVLM: High-Efficiency and High-Quality Synthetic Data for Vision Language Models
要約 最近、Web 画像の台頭により、大規模な画像データセットの管理と理解の重要 … 続きを読む
Fast Multipole Attention: A Divide-and-Conquer Attention Mechanism for Long Sequences
要約 トランスベースのモデルは、多くの分野で最先端のパフォーマンスを実現していま … 続きを読む
Enabling Contextual Soft Moderation on Social Media through Contrastive Textual Deviation
要約 自動化されたソフト モデレーション システムは、投稿が虚偽の主張を支持して … 続きを読む
Language-based Valence and Arousal Expressions between the United States and China: a Cross-Cultural Examination
要約 個人の感情表現はソーシャル メディアを使用して広範囲に研究されていますが、 … 続きを読む
Architectural Influence on Variational Quantum Circuits in Multi-Agent Reinforcement Learning: Evolutionary Strategies for Optimization
要約 近年、マルチエージェント強化学習 (MARL) は、自動運転、電気通信、世 … 続きを読む
JaColBERTv2.5: Optimising Multi-Vector Retrievers to Create State-of-the-Art Japanese Retrievers with Constrained Resources
要約 神経情報検索は、高リソース言語では急速に進歩していますが、日本語などの低リ … 続きを読む
Efficient Quantum One-Class Support Vector Machines for Anomaly Detection Using Randomized Measurements and Variable Subsampling
要約 量子 1 クラス サポート ベクター マシンは、半教師あり異常検出に量子カ … 続きを読む
Cost-Based Semantics for Querying Inconsistent Weighted Knowledge Bases
要約 この論文では、一貫性のない記述ロジックの知識ベースをクエリするための定量的 … 続きを読む
Improving Zero-shot Generalization of Learned Prompts via Unsupervised Knowledge Distillation
要約 視覚言語モデル (VLM) は、目に見えないタスクに対して顕著なゼロショッ … 続きを読む
OmniBal: Towards Fast Instruct-tuning for Vision-Language Models via Omniverse Computation Balance
要約 最近、視覚言語命令調整モデルは、世界をより包括的に理解できるようになり、大 … 続きを読む
カテゴリー: cs.AI
OmniBal: Towards Fast Instruct-tuning for Vision-Language Models via Omniverse Computation Balance はコメントを受け付けていません