cs.CL」カテゴリーアーカイブ

LLaVA-Mini: Efficient Image and Video Large Multimodal Models with One Vision Token

要約 GPT-4o のようなリアルタイム大規模マルチモーダル モデル (LMM) … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | LLaVA-Mini: Efficient Image and Video Large Multimodal Models with One Vision Token はコメントを受け付けていません

Finer: Investigating and Enhancing Fine-Grained Visual Concept Recognition in Large Vision Language Models

要約 命令調整された Large Vision-Language Model ( … 続きを読む

カテゴリー: cs.CL, cs.CV | Finer: Investigating and Enhancing Fine-Grained Visual Concept Recognition in Large Vision Language Models はコメントを受け付けていません

Dolphin: Closed-loop Open-ended Auto-research through Thinking, Practice, and Feedback

要約 科学研究のパラダイムは、人工知能 (AI) の発展により大きな変革を迎えて … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Dolphin: Closed-loop Open-ended Auto-research through Thinking, Practice, and Feedback はコメントを受け付けていません

Scaling Efficient LLMs

要約 トレーニングされた LLM は通常、ほとんどのパラメーターがゼロであるため … 続きを読む

カテゴリー: cs.CL, cs.LG | Scaling Efficient LLMs はコメントを受け付けていません

Lived Experience Not Found: LLMs Struggle to Align with Experts on Addressing Adverse Drug Reactions from Psychiatric Medication Use

要約 精神科治療薬による薬物副作用(ADR)は、メンタルヘルス患者の入院の主な原 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY | Lived Experience Not Found: LLMs Struggle to Align with Experts on Addressing Adverse Drug Reactions from Psychiatric Medication Use はコメントを受け付けていません

Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models

要約 私たちは、状態空間モデル (SSM) の基礎に基づいて構築された、新しい … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models はコメントを受け付けていません

PRMBench: A Fine-grained and Challenging Benchmark for Process-Level Reward Models

要約 プロセス レベルの報酬モデル (PRM) は、複雑な推論および意思決定タス … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | PRMBench: A Fine-grained and Challenging Benchmark for Process-Level Reward Models はコメントを受け付けていません

Benchmark Evaluations, Applications, and Challenges of Large Vision Language Models: A Survey

要約 マルチモーダル ビジョン ランゲージ モデル (VLM) は、コンピュータ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | Benchmark Evaluations, Applications, and Challenges of Large Vision Language Models: A Survey はコメントを受け付けていません

MBTSAD: Mitigating Backdoors in Language Models Based on Token Splitting and Attention Distillation

要約 近年、アテンションベースのモデルはさまざまなドメインで優れていますが、多く … 続きを読む

カテゴリー: cs.CL, cs.CR | MBTSAD: Mitigating Backdoors in Language Models Based on Token Splitting and Attention Distillation はコメントを受け付けていません

BaiJia: A Large-Scale Role-Playing Agent Corpus of Chinese Historical Characters

要約 さまざまな中国の歴史上の人物で構成される、BaiJia と呼ばれる包括的な … 続きを読む

カテゴリー: cs.AI, cs.CL | BaiJia: A Large-Scale Role-Playing Agent Corpus of Chinese Historical Characters はコメントを受け付けていません