cs.CL」カテゴリーアーカイブ

Natural Language as Polices: Reasoning for Coordinate-Level Embodied Control with LLMs

要約 ロボットの行動計画の問題に対処する LLM を使用した実験結果を示します。 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.RO, I.2.7 | Natural Language as Polices: Reasoning for Coordinate-Level Embodied Control with LLMs はコメントを受け付けていません

MMICL: Empowering Vision-language Model with Multi-Modal In-Context Learning

要約 深層学習が復活して以来、大規模言語モデル (LLM) によって強化されたビ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | MMICL: Empowering Vision-language Model with Multi-Modal In-Context Learning はコメントを受け付けていません

m&m’s: A Benchmark to Evaluate Tool-Use for multi-step multi-modal Tasks

要約 現実世界のマルチモーダルな問題は、単一の機械学習モデルで解決されることはほ … 続きを読む

カテゴリー: cs.CL, cs.CV | m&m’s: A Benchmark to Evaluate Tool-Use for multi-step multi-modal Tasks はコメントを受け付けていません

ZigMa: Zigzag Mamba Diffusion Model

要約 拡散モデルは、特にトランスベースの構造内で、スケーラビリティと二次複雑性の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | ZigMa: Zigzag Mamba Diffusion Model はコメントを受け付けていません

Learning from Models and Data for Visual Grounding

要約 SynGround は、データ駆動型学習とさまざまな大規模な事前トレーニン … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Learning from Models and Data for Visual Grounding はコメントを受け付けていません

Generative Multimodal Entity Linking

要約 マルチモーダル エンティティ リンク (MEL) は、マルチモーダル コン … 続きを読む

カテゴリー: cs.CL | Generative Multimodal Entity Linking はコメントを受け付けていません

Shared and Private Information Learning in Multimodal Sentiment Analysis with Deep Modal Alignment and Self-supervised Multi-Task Learning

要約 マルチモーダル感情分析タスクのための効果的な表現学習方法を設計することは、 … 続きを読む

カテゴリー: cs.CL, cs.CV | Shared and Private Information Learning in Multimodal Sentiment Analysis with Deep Modal Alignment and Self-supervised Multi-Task Learning はコメントを受け付けていません

CASIMIR: A Corpus of Scientific Articles enhanced with Multiple Author-Integrated Revisions

要約 科学論文を書くことは、高度に成文化され特殊なジャンルであるため、困難な作業 … 続きを読む

カテゴリー: cs.CL | CASIMIR: A Corpus of Scientific Articles enhanced with Multiple Author-Integrated Revisions はコメントを受け付けていません

Factorized Learning Assisted with Large Language Model for Gloss-free Sign Language Translation

要約 以前の手話翻訳 (SLT) メソッドは、光沢注釈に依存することで優れたパフ … 続きを読む

カテゴリー: cs.CL | Factorized Learning Assisted with Large Language Model for Gloss-free Sign Language Translation はコメントを受け付けていません

BAMBOO: A Comprehensive Benchmark for Evaluating Long Text Modeling Capacities of Large Language Models

要約 大規模言語モデル (LLM) は、通常の長さの NLP タスクよりも劇的な … 続きを読む

カテゴリー: cs.CL | BAMBOO: A Comprehensive Benchmark for Evaluating Long Text Modeling Capacities of Large Language Models はコメントを受け付けていません