cs.CL」カテゴリーアーカイブ

CompassJudger-1: All-in-one Judge Model Helps Model Evaluation and Evolution

要約 大規模言語モデル (LLM) を継続的に改善するには、効率的かつ正確な評価 … 続きを読む

カテゴリー: cs.AI, cs.CL | CompassJudger-1: All-in-one Judge Model Helps Model Evaluation and Evolution はコメントを受け付けていません

RACCooN: A Versatile Instructional Video Editing Framework with Auto-Generated Narratives

要約 最近のビデオ生成モデルは主に、修復やスタイル編集などの特定のタスクについて … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | RACCooN: A Versatile Instructional Video Editing Framework with Auto-Generated Narratives はコメントを受け付けていません

Pangea: A Fully Open Multilingual Multimodal LLM for 39 Languages

要約 マルチモーダル大規模言語モデル (MLLM) の最近の進歩にもかかわらず、 … 続きを読む

カテゴリー: cs.CL, cs.CV | Pangea: A Fully Open Multilingual Multimodal LLM for 39 Languages はコメントを受け付けていません

Sparkle: Mastering Basic Spatial Capabilities in Vision Language Models Elicits Generalization to Composite Spatial Reasoning

要約 ビジョン言語モデル (VLM) は、幅広い下流タスクにわたって優れたパフォ … 続きを読む

カテゴリー: cs.CL, cs.CV | Sparkle: Mastering Basic Spatial Capabilities in Vision Language Models Elicits Generalization to Composite Spatial Reasoning はコメントを受け付けていません

Beyond Filtering: Adaptive Image-Text Quality Enhancement for MLLM Pretraining

要約 マルチモーダル大規模言語モデル (MLLM) は、ビジュアル モダリティと … 続きを読む

カテゴリー: cs.CL, cs.CV | Beyond Filtering: Adaptive Image-Text Quality Enhancement for MLLM Pretraining はコメントを受け付けていません

xGen-MM-Vid (BLIP-3-Video): You Only Need 32 Tokens to Represent a Video Even in VLMs

要約 我々は、xGen-MM-Vid (BLIP-3-Video) を紹介します … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | xGen-MM-Vid (BLIP-3-Video): You Only Need 32 Tokens to Represent a Video Even in VLMs はコメントを受け付けていません

Coherence-Driven Multimodal Safety Dialogue with Active Learning for Embodied Agents

要約 日常業務で人間を支援する場合、ロボットは視覚的な合図を正確に解釈し、床上の … 続きを読む

カテゴリー: cs.CL, cs.RO | Coherence-Driven Multimodal Safety Dialogue with Active Learning for Embodied Agents はコメントを受け付けていません

Unlearning Backdoor Attacks for LLMs with Weak-to-Strong Knowledge Distillation

要約 パラメーター効率の良い微調整 (PEFT) は、大規模言語モデル (LLM … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR | Unlearning Backdoor Attacks for LLMs with Weak-to-Strong Knowledge Distillation はコメントを受け付けていません

Large Language Models, scientific knowledge and factuality: A framework to streamline human expert evaluation

要約 この論文では、一般に分野の専門家によって行われる手動の評価プロセスを合理化 … 続きを読む

カテゴリー: cs.AI, cs.CL | Large Language Models, scientific knowledge and factuality: A framework to streamline human expert evaluation はコメントを受け付けていません

Towards Lifelong Dialogue Agents via Relation-aware Memory Construction and Timeline-augmented Response Generation

要約 生涯にわたる人間とエージェントの対話を実現するには、対話エージェントは認識 … 続きを読む

カテゴリー: cs.CL | Towards Lifelong Dialogue Agents via Relation-aware Memory Construction and Timeline-augmented Response Generation はコメントを受け付けていません