-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2023年7月
Domain-Agnostic Tuning-Encoder for Fast Personalization of Text-To-Image Models
要約 Text-to-image (T2I) パーソナライゼーションにより、ユー … 続きを読む
mBLIP: Efficient Bootstrapping of Multilingual Vision-LLMs
要約 モジュール式ビジョン言語モデル (Vision-LLM) は、事前トレーニ … 続きを読む
Animate-A-Story: Storytelling with Retrieval-Augmented Video Generation
要約 視覚的なストーリーテリング用のビデオの生成は、通常、実写撮影またはグラフィ … 続きを読む
カテゴリー: cs.CV
Animate-A-Story: Storytelling with Retrieval-Augmented Video Generation はコメントを受け付けていません
On the Connection between Game-Theoretic Feature Attributions and Counterfactual Explanations
要約 説明可能な人工知能 (XAI) は近年広く関心を集めており、最も人気のある … 続きを読む
InternVid: A Large-scale Video-Text Dataset for Multimodal Understanding and Generation
要約 この論文では、マルチモーダルの理解と生成のための強力で転送可能なビデオ テ … 続きを読む
カテゴリー: cs.CV
InternVid: A Large-scale Video-Text Dataset for Multimodal Understanding and Generation はコメントを受け付けていません
Video-FocalNets: Spatio-Temporal Focal Modulation for Video Action Recognition
要約 最近のビデオ認識モデルは、長距離の時空間コンテキスト モデリングに Tra … 続きを読む
Self-regulating Prompts: Foundational Model Adaptation without Forgetting
要約 即時学習は、さまざまな下流タスク向けに CLIP などの基本モデルを微調整 … 続きを読む
カテゴリー: cs.CV
Self-regulating Prompts: Foundational Model Adaptation without Forgetting はコメントを受け付けていません
HyperDreamBooth: HyperNetworks for Fast Personalization of Text-to-Image Models
要約 パーソナライゼーションは、生成 AI の分野で顕著な側面として浮上しており … 続きを読む
Provably Faster Gradient Descent via Long Steps
要約 この研究では、コンピューター支援分析技術を使用して、勾配降下法でより高速な … 続きを読む
PatternGPT :A Pattern-Driven Framework for Large Language Model Text Generation
要約 大規模言語モデル (LLMS) は、多くの下流タスクに対して流暢な応答を生 … 続きを読む