「cs.CL」カテゴリーアーカイブ

CompassJudger-1: All-in-one Judge Model Helps Model Evaluation and Evolution

投稿日: 2024年10月22日作成者: jarxiv

要約大規模言語モデル (LLM) を継続的に改善するには、効率的かつ正確な評価 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

RACCooN: A Versatile Instructional Video Editing Framework with Auto-Generated Narratives

投稿日: 2024年10月22日作成者: jarxiv

要約最近のビデオ生成モデルは主に、修復やスタイル編集などの特定のタスクについて … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Pangea: A Fully Open Multilingual Multimodal LLM for 39 Languages

投稿日: 2024年10月22日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) の最近の進歩にもかかわらず、 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Sparkle: Mastering Basic Spatial Capabilities in Vision Language Models Elicits Generalization to Composite Spatial Reasoning

投稿日: 2024年10月22日作成者: jarxiv

要約ビジョン言語モデル (VLM) は、幅広い下流タスクにわたって優れたパフォ … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Beyond Filtering: Adaptive Image-Text Quality Enhancement for MLLM Pretraining

投稿日: 2024年10月22日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) は、ビジュアルモダリティと … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

xGen-MM-Vid (BLIP-3-Video): You Only Need 32 Tokens to Represent a Video Even in VLMs

投稿日: 2024年10月22日作成者: jarxiv

要約我々は、xGen-MM-Vid (BLIP-3-Video) を紹介します … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Coherence-Driven Multimodal Safety Dialogue with Active Learning for Embodied Agents

投稿日: 2024年10月21日作成者: jarxiv

要約日常業務で人間を支援する場合、ロボットは視覚的な合図を正確に解釈し、床上の … 続きを読む →

カテゴリー: cs.CL, cs.RO | コメントを受け付けていません

Unlearning Backdoor Attacks for LLMs with Weak-to-Strong Knowledge Distillation

投稿日: 2024年10月21日作成者: jarxiv

要約パラメーター効率の良い微調整 (PEFT) は、大規模言語モデル (LLM … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR | コメントを受け付けていません

Large Language Models, scientific knowledge and factuality: A framework to streamline human expert evaluation

投稿日: 2024年10月21日作成者: jarxiv

要約この論文では、一般に分野の専門家によって行われる手動の評価プロセスを合理化 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Towards Lifelong Dialogue Agents via Relation-aware Memory Construction and Timeline-augmented Response Generation

投稿日: 2024年10月21日作成者: jarxiv

要約生涯にわたる人間とエージェントの対話を実現するには、対話エージェントは認識 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

CompassJudger-1: All-in-one Judge Model Helps Model Evaluation and Evolution

RACCooN: A Versatile Instructional Video Editing Framework with Auto-Generated Narratives

Pangea: A Fully Open Multilingual Multimodal LLM for 39 Languages

Sparkle: Mastering Basic Spatial Capabilities in Vision Language Models Elicits Generalization to Composite Spatial Reasoning

Beyond Filtering: Adaptive Image-Text Quality Enhancement for MLLM Pretraining

xGen-MM-Vid (BLIP-3-Video): You Only Need 32 Tokens to Represent a Video Even in VLMs

Coherence-Driven Multimodal Safety Dialogue with Active Learning for Embodied Agents

Unlearning Backdoor Attacks for LLMs with Weak-to-Strong Knowledge Distillation

Large Language Models, scientific knowledge and factuality: A framework to streamline human expert evaluation

Towards Lifelong Dialogue Agents via Relation-aware Memory Construction and Timeline-augmented Response Generation

最近の投稿

最近のコメント

アーカイブ

カテゴリー