-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Title block detection and information extraction for enhanced building drawings search
要約 建築、エンジニアリング、および建設(AEC)業界は、建物の建設、メンテナン … 続きを読む
Fine-Grained Retrieval-Augmented Generation for Visual Question Answering
要約 視覚的な質問回答(VQA)は、画像からの情報を利用することにより、自然言語 … 続きを読む
Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model
要約 このテクニカルレポートは、ビデオジェネレーションファンデーションモデルをト … 続きを読む
Visual Chronicles: Using Multimodal LLMs to Analyze Massive Collections of Images
要約 マルチモーダルLLMS(MLLM)を使用してシステムを提示して、時間的変化 … 続きを読む
Steering CLIP’s vision transformer with sparse autoencoders
要約 ビジョンモデルは非常に有能ですが、内部メカニズムはよく理解されていません。 … 続きを読む
Pangu Ultra: Pushing the Limits of Dense Large Language Models on Ascend NPUs
要約 1,350億パラメーターとAscend Neural Processing … 続きを読む
AerialVG: A Challenging Benchmark for Aerial Visual Grounding by Exploring Positional Relations
要約 Visual Grounding(VG)は、自然言語の説明に基づいて画像に … 続きを読む
CORTEX-AVD: A Framework for CORner Case Testing and EXploration in Autonomous Vehicle Development
要約 自律車(AVS)は、人為的エラーを減らすことにより、交通の安全性と効率を改 … 続きを読む
ChatEMG: Synthetic Data Generation to Control a Robotic Hand Orthosis for Stroke
要約 脳卒中患者の手矯正の意図は、データ収集の難しさのために困難です。 さらに、 … 続きを読む