cs.CL」カテゴリーアーカイブ

G-VEval: A Versatile Metric for Evaluating Image and Video Captions Using GPT-4o

要約 視覚的なキャプションの評価指標は重要ですが、十分に検討されていません。 B … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | G-VEval: A Versatile Metric for Evaluating Image and Video Captions Using GPT-4o はコメントを受け付けていません

Movie2Story: A framework for understanding videos and telling stories in the form of novel text

要約 マルチモーダルビデオからテキストへのモデルは、主にビデオコンテンツの簡単な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Movie2Story: A framework for understanding videos and telling stories in the form of novel text はコメントを受け付けていません

Till the Layers Collapse: Compressing a Deep Neural Network through the Lenses of Batch Normalization Layers

要約 現在、ディープ ニューラル ネットワークはさまざまな複雑なタスクを処理でき … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Till the Layers Collapse: Compressing a Deep Neural Network through the Lenses of Batch Normalization Layers はコメントを受け付けていません

Prompt-A-Video: Prompt Your Video Diffusion Model via Preference-Aligned LLM

要約 テキストからビデオへのモデルは、高品質のテキストとビデオのペアの最適化を通 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM | Prompt-A-Video: Prompt Your Video Diffusion Model via Preference-Aligned LLM はコメントを受け付けていません

LlamaFusion: Adapting Pretrained Language Models for Multimodal Generation

要約 私たちは、マルチモーダル生成機能を備えた事前トレーニング済みのテキスト専用 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | LlamaFusion: Adapting Pretrained Language Models for Multimodal Generation はコメントを受け付けていません

Towards an optimised evaluation of teachers’ discourse: The case of engaging messages

要約 教師のスキルを評価することは、教育の質と生徒の成果を向上させるために非常に … 続きを読む

カテゴリー: cs.CL | Towards an optimised evaluation of teachers’ discourse: The case of engaging messages はコメントを受け付けていません

RAZOR: Sharpening Knowledge by Cutting Bias with Unsupervised Text Rewriting

要約 LLM はさまざまなタスクで優れたパフォーマンスを発揮するため広く使用され … 続きを読む

カテゴリー: cs.CL, cs.LG | RAZOR: Sharpening Knowledge by Cutting Bias with Unsupervised Text Rewriting はコメントを受け付けていません

Online Intrinsic Rewards for Decision Making Agents from Large Language Model Feedback

要約 自然言語記述からの高密度報酬の自動合成は、強化学習 (RL) における有望 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.RO | Online Intrinsic Rewards for Decision Making Agents from Large Language Model Feedback はコメントを受け付けていません

EXIT: Context-Aware Extractive Compression for Enhancing Retrieval-Augmented Generation

要約 質問応答 (QA) における検索拡張生成 (RAG) の有効性と効率の両方 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | EXIT: Context-Aware Extractive Compression for Enhancing Retrieval-Augmented Generation はコメントを受け付けていません

RACQUET: Unveiling the Dangers of Overlooked Referential Ambiguity in Visual LLMs

要約 あいまいさの解決は効果的なコミュニケーションの鍵です。 人間は会話のグラウ … 続きを読む

カテゴリー: cs.CL | RACQUET: Unveiling the Dangers of Overlooked Referential Ambiguity in Visual LLMs はコメントを受け付けていません