-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
PLA4D: Pixel-Level Alignments for Text-to-4D Gaussian Splatting
要約 テキスト条件付き拡散モデル (DM) が画像、ビデオ、および 3D 生成に … 続きを読む
Global Clipper: Enhancing Safety and Reliability of Transformer-based Object Detection Models
要約 変圧器ベースの物体検出モデルが進歩するにつれて、自動運転車や航空などの重要 … 続きを読む
Position: Quo Vadis, Unsupervised Time Series Anomaly Detection?
要約 Timeseries Anomaly Detection (TAD) にお … 続きを読む
Prompt-based Visual Alignment for Zero-shot Policy Transfer
要約 RL の過学習は、強化学習 (RL) への応用に対する主な障害の 1 つと … 続きを読む
Deep Generative Models for Proton Zero Degree Calorimeter Simulations in ALICE, CERN
要約 検出器の応答をシミュレーションすることは、CERN の大型ハドロン衝突型加 … 続きを読む
FindingEmo: An Image Dataset for Emotion Recognition in the Wild
要約 FindingEmo は、感情認識に特化した 25,000 画像の注釈を含 … 続きを読む
Mitigating Hallucinations in Large Vision-Language Models with Instruction Contrastive Decoding
要約 大規模視覚言語モデル (LVLM) は、視覚入力から状況に応じて詳細で一貫 … 続きを読む
Robust CLIP: Unsupervised Adversarial Fine-Tuning of Vision Embeddings for Robust Large Vision-Language Models
要約 OpenFlamingo、LLaVA、GPT-4 などのマルチモーダル基盤 … 続きを読む
SelfReDepth: Self-Supervised Real-Time Depth Restoration for Consumer-Grade Sensors
要約 民生用センサーによって生成された深度マップには、不正確な測定値や、システム … 続きを読む