月別アーカイブ: 2024年1月

Instruct-Imagen: Image Generation with Multi-modal Instruction

要約 本稿では、異種の画像生成タスクに取り組み、未知のタスクに汎化するモデルであ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Instruct-Imagen: Image Generation with Multi-modal Instruction はコメントを受け付けていません

Lon-ea at SemEval-2023 Task 11: A Comparison of Activation Functions for Soft and Hard Label Prediction

要約 我々は、不一致を伴う学習タスクにおける、ソフト及びハードラベル予測のための … 続きを読む

カテゴリー: cs.CL, cs.LG, I.2.7 | Lon-ea at SemEval-2023 Task 11: A Comparison of Activation Functions for Soft and Hard Label Prediction はコメントを受け付けていません

A Mechanistic Understanding of Alignment Algorithms: A Case Study on DPO and Toxicity

要約 アライメントアルゴリズムは、現在、事前学習された言語モデルをユーザの嗜好に … 続きを読む

カテゴリー: cs.AI, cs.CL | A Mechanistic Understanding of Alignment Algorithms: A Case Study on DPO and Toxicity はコメントを受け付けていません

Revisiting Zero-Shot Abstractive Summarization in the Era of Large Language Models from the Perspective of Position Bias

要約 我々は、ラージ・ランゲージ・モデル(LLM)におけるゼロショット抽象的要約 … 続きを読む

カテゴリー: cs.AI, cs.CL | Revisiting Zero-Shot Abstractive Summarization in the Era of Large Language Models from the Perspective of Position Bias はコメントを受け付けていません

Self-Contrast: Better Reflection Through Inconsistent Solving Perspectives

要約 ラージ・ランゲージ・モデル(LLM)のリフレクション能力は注目されている。 … 続きを読む

カテゴリー: cs.AI, cs.CL | Self-Contrast: Better Reflection Through Inconsistent Solving Perspectives はコメントを受け付けていません

VideoChat: Chat-Centric Video Understanding

要約 本論文では、VideoChatと呼ばれる、エンドツーエンドのチャット中心の … 続きを読む

カテゴリー: cs.CL, cs.CV | VideoChat: Chat-Centric Video Understanding はコメントを受け付けていません

GIT-Mol: A Multi-modal Large Language Model for Molecular Science with Graph, Image, and Text

要約 大規模な言語モデルは、分子のテキスト表現を処理することにより、分子科学にお … 続きを読む

カテゴリー: cs.CL, cs.LG, q-bio.BM | GIT-Mol: A Multi-modal Large Language Model for Molecular Science with Graph, Image, and Text はコメントを受け付けていません

Text2MDT: Extracting Medical Decision Trees from Medical Texts

要約 医療意思決定支援システムを構築するためには、医療意思決定ツリー(MDT)と … 続きを読む

カテゴリー: cs.CL | Text2MDT: Extracting Medical Decision Trees from Medical Texts はコメントを受け付けていません

Understanding LLMs: A Comprehensive Overview from Training to Inference

要約 ChatGPTの導入により、下流タスクに対応するための大規模言語モデル(L … 続きを読む

カテゴリー: cs.CL | Understanding LLMs: A Comprehensive Overview from Training to Inference はコメントを受け付けていません

Theory of Hallucinations based on Equivariance

要約 本研究の目的は、幻覚を起こさない超大規模言語モデルを作成するための知識を得 … 続きを読む

カテゴリー: cs.CL, cs.LG | Theory of Hallucinations based on Equivariance はコメントを受け付けていません