cs.CL」カテゴリーアーカイブ

Entity-Aware Multimodal Alignment Framework for News Image Captioning

要約 ニュース画像のキャプション タスクは、画像キャプション タスクの変形であり … 続きを読む

カテゴリー: cs.CL, cs.CV | Entity-Aware Multimodal Alignment Framework for News Image Captioning はコメントを受け付けていません

TV-TREES: Multimodal Entailment Trees for Neuro-Symbolic Video Reasoning

要約 テレビ クリップなどの複雑でマルチモーダルなコンテンツに対して質問応答を実 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, I.2.10 | TV-TREES: Multimodal Entailment Trees for Neuro-Symbolic Video Reasoning はコメントを受け付けていません

Language Models Represent Beliefs of Self and Others

要約 心の理論 (ToM) として知られる精神状態の理解と帰属は、人間の社会的推 … 続きを読む

カテゴリー: cs.AI, cs.CL | Language Models Represent Beliefs of Self and Others はコメントを受け付けていません

A Cognitive Evaluation Benchmark of Image Reasoning and Description for Large Vision Language Models

要約 Large Vision Language Model (LVLM) は、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | A Cognitive Evaluation Benchmark of Image Reasoning and Description for Large Vision Language Models はコメントを受け付けていません

Investigation of Adapter for Automatic Speech Recognition in Noisy Environment

要約 自動音声認識 (ASR) システムを目に見えない騒音環境に適応させることが … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Investigation of Adapter for Automatic Speech Recognition in Noisy Environment はコメントを受け付けていません

RNNs are not Transformers (Yet): The Key Bottleneck on In-context Retrieval

要約 この論文では、アルゴリズムの問​​題を解決するという観点から、リカレント … 続きを読む

カテゴリー: cs.CL, cs.LG, stat.ML | RNNs are not Transformers (Yet): The Key Bottleneck on In-context Retrieval はコメントを受け付けていません

Arithmetic Control of LLMs for Diverse User Preferences: Directional Preference Alignment with Multi-Objective Rewards

要約 大規模言語モデル (LLM) に対するきめ細かい制御は依然として大きな課題 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | Arithmetic Control of LLMs for Diverse User Preferences: Directional Preference Alignment with Multi-Objective Rewards はコメントを受け付けていません

DecisionNCE: Embodied Multimodal Representations via Implicit Preference Learning

要約 マルチモーダル事前トレーニングは、自律ロボットにおける表現学習の次の 3 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | DecisionNCE: Embodied Multimodal Representations via Implicit Preference Learning はコメントを受け付けていません

Exploring Precision and Recall to assess the quality and diversity of LLMs

要約 この論文では、画像生成からテキスト生成までの精度と再現率のメトリクスの適応 … 続きを読む

カテゴリー: cs.CL, cs.LG | Exploring Precision and Recall to assess the quality and diversity of LLMs はコメントを受け付けていません

LLM Task Interference: An Initial Study on the Impact of Task-Switch in Conversational History

要約 最近の強力な命令調整型大規模言語モデル (LLM) の出現により、さまざま … 続きを読む

カテゴリー: cs.CL | LLM Task Interference: An Initial Study on the Impact of Task-Switch in Conversational History はコメントを受け付けていません