cs.CL」カテゴリーアーカイブ

Do Large Multimodal Models Solve Caption Generation for Scientific Figures? Lessons Learned from SCICAP Challenge 2023

要約 SCICAPデータセットが2021年に開始されて以来、研究コミュニティは学 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Do Large Multimodal Models Solve Caption Generation for Scientific Figures? Lessons Learned from SCICAP Challenge 2023 はコメントを受け付けていません

Understanding Figurative Meaning through Explainable Visual Entailment

要約 大規模なビジョン言語モデル(VLM)は、視覚的な質問や視覚的誘惑など、画像 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Understanding Figurative Meaning through Explainable Visual Entailment はコメントを受け付けていません

Unhackable Temporal Rewarding for Scalable Video MLLMs

要約 優れたビデオ処理MLLMを追求するために、私たちは困惑するパラドックスに遭 … 続きを読む

カテゴリー: cs.CL, cs.CV | Unhackable Temporal Rewarding for Scalable Video MLLMs はコメントを受け付けていません

CLEAR: Character Unlearning in Textual and Visual Modalities

要約 Machine Ulderning(MU)は、深い学習モデルからプライベー … 続きを読む

カテゴリー: cs.CL, cs.CV | CLEAR: Character Unlearning in Textual and Visual Modalities はコメントを受け付けていません

Both Text and Images Leaked! A Systematic Analysis of Multimodal LLM Data Contamination

要約 マルチモーダル大手言語モデル(MLLMS)の急速な進行により、さまざまなマ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | Both Text and Images Leaked! A Systematic Analysis of Multimodal LLM Data Contamination はコメントを受け付けていません

PRISM: Self-Pruning Intrinsic Selection Method for Training-Free Multimodal Data Selection

要約 ビジュアルインストラクションチューニングにより、事前に訓練されたマルチモー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | PRISM: Self-Pruning Intrinsic Selection Method for Training-Free Multimodal Data Selection はコメントを受け付けていません

ORI: O Routing Intelligence

要約 単一の大きな言語モデル(LLM)は、成長し続ける範囲のタスクに直面したとき … 続きを読む

カテゴリー: cs.CL | ORI: O Routing Intelligence はコメントを受け付けていません

Step-Video-T2V Technical Report: The Practice, Challenges, and Future of Video Foundation Model

要約 30Bパラメーターと最大204フレームの長さまでのビデオを生成する機能を備 … 続きを読む

カテゴリー: cs.CL, cs.CV | Step-Video-T2V Technical Report: The Practice, Challenges, and Future of Video Foundation Model はコメントを受け付けていません

SELP: Generating Safe and Efficient Task Plans for Robot Agents with Large Language Models

要約 ロボットエージェントの自然言語(NL)コマンドの理解と実行を強化する大規模 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.FL, cs.RO | SELP: Generating Safe and Efficient Task Plans for Robot Agents with Large Language Models はコメントを受け付けていません

Probabilistic Lexical Manifold Construction in Large Language Models via Hierarchical Vector Field Interpolation

要約 階層ベクトルフィールド補間は、語彙表現のための構造化された確率的フレームワ … 続きを読む

カテゴリー: cs.CL | Probabilistic Lexical Manifold Construction in Large Language Models via Hierarchical Vector Field Interpolation はコメントを受け付けていません