-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
A Lightweight Dual-Branch System for Weakly-Supervised Video Anomaly Detection on Consumer Edge Devices
要約 スマートホームカメラや個人監視システムなど、家電のインテリジェントなセキュ … 続きを読む
Visual Graph Arena: Evaluating Visual Conceptualization of Vision and Multimodal Large Language Models
要約 マルチモーダルの大手言語モデルの最近の進歩は、視覚的な質問に応答するブレー … 続きを読む
LlavaGuard: An Open VLM-based Framework for Safeguarding Vision Datasets and Models
要約 このペーパーでは、大規模なデータとモデルの時代における信頼できるガードレー … 続きを読む
Sparse Autoencoders Learn Monosemantic Features in Vision-Language Models
要約 AIの安全性にとって解釈可能性と操縦性が重要であることを考えると、スパース … 続きを読む
MimeQA: Towards Socially-Intelligent Nonverbal Foundation Models
要約 AIが人々の日常活動とより密接に統合されるようになるにつれて、日常生活で人 … 続きを読む
Exploring Diffusion Transformer Designs via Grafting
要約 モデルアーキテクチャの設計には、オペレーター(注意、畳み込みなど)や構成( … 続きを読む
Teaming in the AI Era: AI-Augmented Frameworks for Forming, Simulating, and Optimizing Human Teams
要約 効果的なチームワークは、多様なドメインで不可欠です。 チームの形成段階では … 続きを読む
Does It Make Sense to Speak of Introspection in Large Language Models?
要約 大規模な言語モデル(LLM)は、魅力的な言語行動を示し、時には自己報告を提 … 続きを読む
ECoRAG: Evidentiality-guided Compression for Long Context RAG
要約 大規模な言語モデル(LLMS)は、検索された生成(RAG)を通じて外部ドキ … 続きを読む
Dissecting Bias in LLMs: A Mechanistic Interpretability Perspective
要約 大規模な言語モデル(LLM)は、多くの場合、訓練されているデータの結果とし … 続きを読む