cs.CL」カテゴリーアーカイブ

Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context

要約 このレポートでは、Gemini 1.5 ファミリのモデルを紹介します。これ … 続きを読む

カテゴリー: cs.AI, cs.CL | Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context はコメントを受け付けていません

Merging Text Transformer Models from Different Initializations

要約 順列ベースのモデルのマージに関する最近の研究では、完全に異なる初期化からの … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Merging Text Transformer Models from Different Initializations はコメントを受け付けていません

Can LLM Prompting Serve as a Proxy for Static Analysis in Vulnerability Detection

要約 大規模言語モデル (LLM) は、目覚ましい成功を収めているにもかかわらず … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.SE | Can LLM Prompting Serve as a Proxy for Static Analysis in Vulnerability Detection はコメントを受け付けていません

MGH Radiology Llama: A Llama 3 70B Model for Radiology

要約 近年、放射線医学の分野では、診断の精度を高め、ワークフローを合理化し、患者 … 続きを読む

カテゴリー: cs.AI, cs.CL | MGH Radiology Llama: A Llama 3 70B Model for Radiology はコメントを受け付けていません

Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment

要約 大規模言語モデル (LLM) の構造化枝刈りは、粗い粒度で冗長な重みグルー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment はコメントを受け付けていません

SepLLM: Accelerate Large Language Models by Compressing One Segment into One Separator

要約 大規模言語モデル (LLM) は、さまざまな自然言語処理タスクにわたって優 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | SepLLM: Accelerate Large Language Models by Compressing One Segment into One Separator はコメントを受け付けていません

Learning from Synthetic Data for Visual Grounding

要約 この論文では、テキストによる説明を画像領域に基礎付けるための視覚および言語 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Learning from Synthetic Data for Visual Grounding はコメントを受け付けていません

GeoX: Geometric Problem Solving Through Unified Formalized Vision-Language Pre-training

要約 マルチモーダル大規模言語モデル (MLLM) は、一般的なタスクには熟練し … 続きを読む

カテゴリー: cs.CL, cs.CV | GeoX: Geometric Problem Solving Through Unified Formalized Vision-Language Pre-training はコメントを受け付けていません

IRR: Image Review Ranking Framework for Evaluating Vision-Language Models

要約 大規模ビジョン言語モデル (LVLM) は、画像とテキストの両方を処理し、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | IRR: Image Review Ranking Framework for Evaluating Vision-Language Models はコメントを受け付けていません

Emma-X: An Embodied Multimodal Action Model with Grounded Chain of Thought and Look-ahead Spatial Reasoning

要約 従来の強化学習ベースのロボット制御手法はタスク固有であることが多く、多様な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | Emma-X: An Embodied Multimodal Action Model with Grounded Chain of Thought and Look-ahead Spatial Reasoning はコメントを受け付けていません