cs.CL」カテゴリーアーカイブ

WoLF: Large Language Model Framework for CXR Understanding

要約 最新の視覚言語モデル (VLM) を介して胸部 X 線 (CXR) の理解 … 続きを読む

カテゴリー: cs.AI, cs.CL | WoLF: Large Language Model Framework for CXR Understanding はコメントを受け付けていません

Retrieval-Enhanced Knowledge Editing for Multi-Hop Question Answering in Language Models

要約 大規模言語モデル (LLM) は、質問応答タスクでは熟練していることを示し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Retrieval-Enhanced Knowledge Editing for Multi-Hop Question Answering in Language Models はコメントを受け付けていません

Sparse Feature Circuits: Discovering and Editing Interpretable Causal Graphs in Language Models

要約 疎な特徴回路を発見して適用する方法を紹介します。 これらは、言語モデルの動 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Sparse Feature Circuits: Discovering and Editing Interpretable Causal Graphs in Language Models はコメントを受け付けていません

Synthesize Step-by-Step: Tools, Templates and LLMs as Data Generators for Reasoning-Based Chart VQA

要約 グラフやプロットなどのデータ視覚化を理解するには、視覚要素と数値の両方につ … 続きを読む

カテゴリー: cs.CL, cs.CV | Synthesize Step-by-Step: Tools, Templates and LLMs as Data Generators for Reasoning-Based Chart VQA はコメントを受け付けていません

Quantifying and Mitigating Unimodal Biases in Multimodal Large Language Models: A Causal Perspective

要約 大規模言語モデル (LLM) の最近の進歩により、マルチモーダル LLM … 続きを読む

カテゴリー: cs.CL, cs.CV | Quantifying and Mitigating Unimodal Biases in Multimodal Large Language Models: A Causal Perspective はコメントを受け付けていません

Semantic Map-based Generation of Navigation Instructions

要約 私たちは、ナビゲーション命令自体の生成、またはロボット ナビゲーション タ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Semantic Map-based Generation of Navigation Instructions はコメントを受け付けていません

MagicLens: Self-Supervised Image Retrieval with Open-Ended Instructions

要約 画像検索、つまり参照画像から目的の画像を見つけることには、本質的に豊富で多 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR, cs.MM | MagicLens: Self-Supervised Image Retrieval with Open-Ended Instructions はコメントを受け付けていません

An Image Grid Can Be Worth a Video: Zero-shot Video Question Answering Using a VLM

要約 最近の大規模言語モデル (LLM) の洗練された推論機能に刺激されて、ビデ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | An Image Grid Can Be Worth a Video: Zero-shot Video Question Answering Using a VLM はコメントを受け付けていません

BioMedLM: A 2.7B Parameter Language Model Trained On Biomedical Text

要約 GPT-4 や Med-PaLM 2 などのモデルは、さまざまな生物医学 … 続きを読む

カテゴリー: cs.AI, cs.CL | BioMedLM: A 2.7B Parameter Language Model Trained On Biomedical Text はコメントを受け付けていません

OpenMoE: An Early Effort on Open Mixture-of-Experts Language Models

要約 オープンソース コミュニティが専門家混合 (MoE) ベースの大規模言語モ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DC, cs.LG | OpenMoE: An Early Effort on Open Mixture-of-Experts Language Models はコメントを受け付けていません