-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
A Multi-Loss Strategy for Vehicle Trajectory Prediction: Combining Off-Road, Diversity, and Directional Consistency Losses
要約 軌道予測は、自動運転車の計画の安全性と効率性にとって不可欠です。 しかし、 … 続きを読む
LaVIDE: A Language-Vision Discriminator for Detecting Changes in Satellite Image with Map References
要約 通常、二時点画像の比較に依存する変更検出は、単一の画像しか利用できない場合 … 続きを読む
A Survey on Multimodal Large Language Models
要約 最近、GPT-4V に代表されるマルチモーダル大規模言語モデル (MLLM … 続きを読む
Efficient Text-driven Motion Generation via Latent Consistency Training
要約 拡散戦略に基づくテキスト駆動の人間の動作生成は、人間とコンピューターの対話 … 続きを読む
Quantifying the synthetic and real domain gap in aerial scene understanding
要約 合成画像と現実世界の画像の間のギャップを定量化することは、大量のデータに依 … 続きを読む
SIMS: Simulating Human-Scene Interactions with Real World Script Planning
要約 長期にわたるヒューマンシーンとシーンのインタラクションをシミュレートするこ … 続きを読む
VLSBench: Unveiling Visual Leakage in Multimodal Safety
要約 マルチモーダル大規模言語モデル (MLLM) の安全性に関する懸念は、さま … 続きを読む
Reanimating Images using Neural Representations of Dynamic Stimuli
要約 コンピューター ビジョン モデルは、静的画像認識において驚くべき進歩を遂げ … 続きを読む
DELT: A Simple Diversity-driven EarlyLate Training for Dataset Distillation
要約 データセットの蒸留における最近の進歩により、2 つの主な方向での解決策が導 … 続きを読む
Large Language Model-Brained GUI Agents: A Survey
要約 GUI は長い間、人間とコンピューターの対話の中心であり、デジタル システ … 続きを読む