cs.CL」カテゴリーアーカイブ

Multimodal Emotion Recognition using Audio-Video Transformer Fusion with Cross Attention

要約 感情を理解することは、人間のコミュニケーションの基本的な側面です。 オーデ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.MM, cs.SD, eess.AS, F.2.2 | Multimodal Emotion Recognition using Audio-Video Transformer Fusion with Cross Attention はコメントを受け付けていません

GroundCap: A Visually Grounded Image Captioning Dataset

要約 現在の画像キャプションシステムには、説明テキストを特定の視覚要素にリンクす … 続きを読む

カテゴリー: cs.CL, cs.CV, I.2.10 | GroundCap: A Visually Grounded Image Captioning Dataset はコメントを受け付けていません

Qwen2.5-VL Technical Report

要約 QWEN Vision-Languageシリーズの最新のフラッグシップモデ … 続きを読む

カテゴリー: cs.CL, cs.CV | Qwen2.5-VL Technical Report はコメントを受け付けていません

Symmetrical Visual Contrastive Optimization: Aligning Vision-Language Models with Minimal Contrastive Images

要約 最近の研究では、大きなビジョン言語モデル(VLM)が画像コンテンツを無視し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Symmetrical Visual Contrastive Optimization: Aligning Vision-Language Models with Minimal Contrastive Images はコメントを受け付けていません

Can a Single Model Master Both Multi-turn Conversations and Tool Use? CoALM: A Unified Conversational Agentic Language Model

要約 APIコール機能を備えた大規模な言語モデル(LLMS)により、効果的な言語 … 続きを読む

カテゴリー: cs.AI, cs.CL | Can a Single Model Master Both Multi-turn Conversations and Tool Use? CoALM: A Unified Conversational Agentic Language Model はコメントを受け付けていません

STEER-ME: Assessing the Microeconomic Reasoning of Large Language Models

要約 与えられた大規模な言語モデル(LLM)が経済的推論を確実に実行できるかどう … 続きを読む

カテゴリー: cs.CL | STEER-ME: Assessing the Microeconomic Reasoning of Large Language Models はコメントを受け付けていません

LLMPopcorn: An Empirical Study of LLMs as Assistants for Popular Micro-video Generation

要約 TiktokやYouTubeなどのプラットフォームで支配的な人気のあるマイ … 続きを読む

カテゴリー: cs.CL, cs.CV | LLMPopcorn: An Empirical Study of LLMs as Assistants for Popular Micro-video Generation はコメントを受け付けていません

From Instance Training to Instruction Learning: Task Adapters Generation from Instructions

要約 大規模な言語モデル(LLMS)は、命令Finetuning(IFT)を利用 … 続きを読む

カテゴリー: cs.CL | From Instance Training to Instruction Learning: Task Adapters Generation from Instructions はコメントを受け付けていません

Neural-Symbolic Collaborative Distillation: Advancing Small Language Models for Complex Reasoning Tasks

要約 この論文では、$ \ textbf {ne} $ ural-$ \ tex … 続きを読む

カテゴリー: cs.CL | Neural-Symbolic Collaborative Distillation: Advancing Small Language Models for Complex Reasoning Tasks はコメントを受け付けていません

Large Language Diffusion Models

要約 自己回帰モデル(アーム)は、大規模な言語モデル(LLM)の礎石と広く見なさ … 続きを読む

カテゴリー: cs.CL, cs.LG | Large Language Diffusion Models はコメントを受け付けていません