「cs.CL」カテゴリーアーカイブ

Text-guided Image Restoration and Semantic Enhancement for Text-to-Image Person Retrieval

投稿日: 2024年11月26日作成者: jarxiv

要約テキストから画像への人物検索 (TIPR) の目的は、指定されたテキストの … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

DreamRunner: Fine-Grained Storytelling Video Generation with Retrieval-Augmented Motion Adaptation

投稿日: 2024年11月26日作成者: jarxiv

要約ストーリーテリングビデオ生成 (SVG) は、入力テキストスクリプトで … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Information Extraction from Heterogeneous Documents without Ground Truth Labels using Synthetic Label Generation and Knowledge Distillation

投稿日: 2024年11月26日作成者: jarxiv

要約従業員が提出する請求書と領収書は、テキスト、ビジュアル、レイアウト情報を備 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

KBAlign: Efficient Self Adaptation on Specific Knowledge Bases

投稿日: 2024年11月26日作成者: jarxiv

要約人間は、自己評価質問を作成するなど、事前に特定の資料から知識を迅速に取得す … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

One-Shot Safety Alignment for Large Language Models via Optimal Dualization

投稿日: 2024年11月25日作成者: jarxiv

要約大規模な言語モデルを取り巻く安全性への懸念が高まっているため、有用性と安全 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, math.OC, stat.ML | コメントを受け付けていません

Prompt Framework for Role-playing: Generation and Evaluation

投稿日: 2024年11月25日作成者: jarxiv

要約大規模言語モデル (LLM) は、自然言語の生成、ユーザーの指示の理解、人 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

SlimLM: An Efficient Small Language Model for On-Device Document Assistance

投稿日: 2024年11月25日作成者: jarxiv

要約小規模言語モデル (SLM) はモバイル展開に有望である一方で、スマートフ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

KBAda: Efficient Self Adaptation on Specific Knowledge Bases

投稿日: 2024年11月25日作成者: jarxiv

要約人間は、自己評価質問を作成するなど、事前に特定の資料から知識を迅速に取得す … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

VideoEspresso: A Large-Scale Chain-of-Thought Dataset for Fine-Grained Video Reasoning via Core Frame Selection

投稿日: 2024年11月25日作成者: jarxiv

要約 Large Vision Language Models (LVLM) の … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

De-biased Multimodal Electrocardiogram Analysis

投稿日: 2024年11月25日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) は、医療分野、特に医療画像処 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

Text-guided Image Restoration and Semantic Enhancement for Text-to-Image Person Retrieval

DreamRunner: Fine-Grained Storytelling Video Generation with Retrieval-Augmented Motion Adaptation

Information Extraction from Heterogeneous Documents without Ground Truth Labels using Synthetic Label Generation and Knowledge Distillation

KBAlign: Efficient Self Adaptation on Specific Knowledge Bases

One-Shot Safety Alignment for Large Language Models via Optimal Dualization

Prompt Framework for Role-playing: Generation and Evaluation

SlimLM: An Efficient Small Language Model for On-Device Document Assistance

KBAda: Efficient Self Adaptation on Specific Knowledge Bases

VideoEspresso: A Large-Scale Chain-of-Thought Dataset for Fine-Grained Video Reasoning via Core Frame Selection

De-biased Multimodal Electrocardiogram Analysis

最近の投稿

最近のコメント

アーカイブ

カテゴリー