-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
LLaRA: Supercharging Robot Learning Data for Vision-Language Policy
要約 ビジョン言語モデル(VLM)は最近、ロボットアクションを生成するために活用 … 続きを読む
Temporal Preference Optimization for Long-Form Video Understanding
要約 ビデオの大規模なマルチモーダルモデル(ビデオLMMS)の大幅な進歩にもかか … 続きを読む
R-LLaVA: Improving Med-VQA Understanding through Visual Region of Interest
要約 人工知能は医学的視覚的質問応答(MED-VQA)に大きな進歩を遂げましたが … 続きを読む
Vision-based autonomous structural damage detection using data-driven methods
要約 この研究では、再生可能エネルギーインフラストラクチャの重要なコンポーネント … 続きを読む
Inkspire: Supporting Design Exploration with Generative AI through Analogical Sketching
要約 テキストツーイメージ(T2I)AIモデルの能力に最近の進歩により、製品設計 … 続きを読む
Advances in Multimodal Adaptation and Generalization: From Traditional Approaches to Foundation Models
要約 実際のシナリオでは、モデルが未知のターゲット分布に適応または一般化する必要 … 続きを読む
Diffusion Autoencoders are Scalable Image Tokenizers
要約 画像をコンパクトな視覚表現にトークン化することは、効率的で高品質の画像生成 … 続きを読む
In-Context Meta LoRA Generation
要約 低ランク適応(LORA)は、タスク固有の微調整の顕著な能力を実証しています … 続きを読む
Slaves to the Law of Large Numbers: An Asymptotic Equipartition Property for Perplexity in Generative Language Models
要約 言語モデルによって生成された長いテキストの困惑と、オープンソースモデルから … 続きを読む
Computing the gradients with respect to all parameters of a quantum neural network using a single circuit
要約 勾配を見つけることは、機械学習モデルをトレーニングする上で重要なステップで … 続きを読む