-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
LLaVA-Mini: Efficient Image and Video Large Multimodal Models with One Vision Token
要約 GPT-4o のようなリアルタイム大規模マルチモーダル モデル (LMM) … 続きを読む
Finer: Investigating and Enhancing Fine-Grained Visual Concept Recognition in Large Vision Language Models
要約 命令調整された Large Vision-Language Model ( … 続きを読む
Dolphin: Closed-loop Open-ended Auto-research through Thinking, Practice, and Feedback
要約 科学研究のパラダイムは、人工知能 (AI) の発展により大きな変革を迎えて … 続きを読む
Scaling Efficient LLMs
要約 トレーニングされた LLM は通常、ほとんどのパラメーターがゼロであるため … 続きを読む
Lived Experience Not Found: LLMs Struggle to Align with Experts on Addressing Adverse Drug Reactions from Psychiatric Medication Use
要約 精神科治療薬による薬物副作用(ADR)は、メンタルヘルス患者の入院の主な原 … 続きを読む
Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models
要約 私たちは、状態空間モデル (SSM) の基礎に基づいて構築された、新しい … 続きを読む
PRMBench: A Fine-grained and Challenging Benchmark for Process-Level Reward Models
要約 プロセス レベルの報酬モデル (PRM) は、複雑な推論および意思決定タス … 続きを読む
Benchmark Evaluations, Applications, and Challenges of Large Vision Language Models: A Survey
要約 マルチモーダル ビジョン ランゲージ モデル (VLM) は、コンピュータ … 続きを読む
MBTSAD: Mitigating Backdoors in Language Models Based on Token Splitting and Attention Distillation
要約 近年、アテンションベースのモデルはさまざまなドメインで優れていますが、多く … 続きを読む
BaiJia: A Large-Scale Role-Playing Agent Corpus of Chinese Historical Characters
要約 さまざまな中国の歴史上の人物で構成される、BaiJia と呼ばれる包括的な … 続きを読む