「cs.CL」カテゴリーアーカイブ

Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context

投稿日: 2024年12月17日作成者: jarxiv

要約このレポートでは、Gemini 1.5 ファミリのモデルを紹介します。これ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Merging Text Transformer Models from Different Initializations

投稿日: 2024年12月17日作成者: jarxiv

要約順列ベースのモデルのマージに関する最近の研究では、完全に異なる初期化からの … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Can LLM Prompting Serve as a Proxy for Static Analysis in Vulnerability Detection

投稿日: 2024年12月17日作成者: jarxiv

要約大規模言語モデル (LLM) は、目覚ましい成功を収めているにもかかわらず … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR, cs.SE | コメントを受け付けていません

MGH Radiology Llama: A Llama 3 70B Model for Radiology

投稿日: 2024年12月17日作成者: jarxiv

要約近年、放射線医学の分野では、診断の精度を高め、ワークフローを合理化し、患者 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment

投稿日: 2024年12月17日作成者: jarxiv

要約大規模言語モデル (LLM) の構造化枝刈りは、粗い粒度で冗長な重みグルー … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

SepLLM: Accelerate Large Language Models by Compressing One Segment into One Separator

投稿日: 2024年12月17日作成者: jarxiv

要約大規模言語モデル (LLM) は、さまざまな自然言語処理タスクにわたって優 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Learning from Synthetic Data for Visual Grounding

投稿日: 2024年12月17日作成者: jarxiv

要約この論文では、テキストによる説明を画像領域に基礎付けるための視覚および言語 … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

GeoX: Geometric Problem Solving Through Unified Formalized Vision-Language Pre-training

投稿日: 2024年12月17日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) は、一般的なタスクには熟練し … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

IRR: Image Review Ranking Framework for Evaluating Vision-Language Models

投稿日: 2024年12月17日作成者: jarxiv

要約大規模ビジョン言語モデル (LVLM) は、画像とテキストの両方を処理し、 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | コメントを受け付けていません

Emma-X: An Embodied Multimodal Action Model with Grounded Chain of Thought and Look-ahead Spatial Reasoning

投稿日: 2024年12月17日作成者: jarxiv

要約従来の強化学習ベースのロボット制御手法はタスク固有であることが多く、多様な … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context

Merging Text Transformer Models from Different Initializations

Can LLM Prompting Serve as a Proxy for Static Analysis in Vulnerability Detection

MGH Radiology Llama: A Llama 3 70B Model for Radiology

Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment

SepLLM: Accelerate Large Language Models by Compressing One Segment into One Separator

Learning from Synthetic Data for Visual Grounding

GeoX: Geometric Problem Solving Through Unified Formalized Vision-Language Pre-training

IRR: Image Review Ranking Framework for Evaluating Vision-Language Models

Emma-X: An Embodied Multimodal Action Model with Grounded Chain of Thought and Look-ahead Spatial Reasoning

最近の投稿

最近のコメント

アーカイブ

カテゴリー