cs.CL」カテゴリーアーカイブ

Text-guided Image Restoration and Semantic Enhancement for Text-to-Image Person Retrieval

要約 テキストから画像への人物検索 (TIPR) の目的は、指定されたテキストの … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Text-guided Image Restoration and Semantic Enhancement for Text-to-Image Person Retrieval はコメントを受け付けていません

DreamRunner: Fine-Grained Storytelling Video Generation with Retrieval-Augmented Motion Adaptation

要約 ストーリーテリング ビデオ生成 (SVG) は、入力テキスト スクリプトで … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | DreamRunner: Fine-Grained Storytelling Video Generation with Retrieval-Augmented Motion Adaptation はコメントを受け付けていません

Information Extraction from Heterogeneous Documents without Ground Truth Labels using Synthetic Label Generation and Knowledge Distillation

要約 従業員が提出する請求書と領収書は、テキスト、ビジュアル、レイアウト情報を備 … 続きを読む

カテゴリー: cs.CL | Information Extraction from Heterogeneous Documents without Ground Truth Labels using Synthetic Label Generation and Knowledge Distillation はコメントを受け付けていません

KBAlign: Efficient Self Adaptation on Specific Knowledge Bases

要約 人間は、自己評価質問を作成するなど、事前に特定の資料から知識を迅速に取得す … 続きを読む

カテゴリー: cs.AI, cs.CL | KBAlign: Efficient Self Adaptation on Specific Knowledge Bases はコメントを受け付けていません

One-Shot Safety Alignment for Large Language Models via Optimal Dualization

要約 大規模な言語モデルを取り巻く安全性への懸念が高まっているため、有用性と安全 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, math.OC, stat.ML | One-Shot Safety Alignment for Large Language Models via Optimal Dualization はコメントを受け付けていません

Prompt Framework for Role-playing: Generation and Evaluation

要約 大規模言語モデル (LLM) は、自然言語の生成、ユーザーの指示の理解、人 … 続きを読む

カテゴリー: cs.CL | Prompt Framework for Role-playing: Generation and Evaluation はコメントを受け付けていません

SlimLM: An Efficient Small Language Model for On-Device Document Assistance

要約 小規模言語モデル (SLM) はモバイル展開に有望である一方で、スマートフ … 続きを読む

カテゴリー: cs.CL | SlimLM: An Efficient Small Language Model for On-Device Document Assistance はコメントを受け付けていません

KBAda: Efficient Self Adaptation on Specific Knowledge Bases

要約 人間は、自己評価質問を作成するなど、事前に特定の資料から知識を迅速に取得す … 続きを読む

カテゴリー: cs.AI, cs.CL | KBAda: Efficient Self Adaptation on Specific Knowledge Bases はコメントを受け付けていません

VideoEspresso: A Large-Scale Chain-of-Thought Dataset for Fine-Grained Video Reasoning via Core Frame Selection

要約 Large Vision Language Models (LVLM) の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | VideoEspresso: A Large-Scale Chain-of-Thought Dataset for Fine-Grained Video Reasoning via Core Frame Selection はコメントを受け付けていません

De-biased Multimodal Electrocardiogram Analysis

要約 マルチモーダル大規模言語モデル (MLLM) は、医療分野、特に医療画像処 … 続きを読む

カテゴリー: cs.CL | De-biased Multimodal Electrocardiogram Analysis はコメントを受け付けていません