-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
A Cognitive Evaluation Benchmark of Image Reasoning and Description for Large Vision Language Models
要約 Large Vision Language Model (LVLM) は、 … 続きを読む
Text2Pic Swift: Enhancing Long-Text to Image Retrieval for Large-Scale Libraries
要約 テキストから画像への検索は、テキスト クエリを使用した画像の検索を可能にす … 続きを読む
TFMQ-DM: Temporal Feature Maintenance Quantization for Diffusion Models
要約 画像生成の一般的なフレームワークである拡散モデルは、推論時間の延長と大量の … 続きを読む
Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models
要約 Sora は、2024 年 2 月に OpenAI によってリリースされた … 続きを読む
ToDo: Token Downsampling for Efficient Generation of High-Resolution Images
要約 注意メカニズムは画像拡散モデルにとって重要ですが、二次計算の複雑さにより、 … 続きを読む
Compass: A Decentralized Scheduler for Latency-Sensitive ML Workflows
要約 私たちは、GPU 対応ワーカーが連携して複雑なクエリを実行する分散システム … 続きを読む
OmniACT: A Dataset and Benchmark for Enabling Multimodal Generalist Autonomous Agents for Desktop and Web
要約 何十年もの間、人間とコンピューターのやり取りは基本的に手動で行われてきまし … 続きを読む
Autonomous Vehicles: Evolution of Artificial Intelligence and Learning Algorithms
要約 自動運転車の出現は交通分野に変革の時代をもたらし、最先端のテクノロジーを通 … 続きを読む
Ask Again, Then Fail: Large Language Models’ Vacillations in Judgement
要約 現在の会話言語モデルは、たとえ最初の判断が正しかったとしても、フォローアッ … 続きを読む
Robot at the Mirror: Learning to Imitate via Associating Self-supervised Models
要約 トレーニングや微調整ではなく、関連付けを介して既製の自己教師ありモデルから … 続きを読む