cs.CL」カテゴリーアーカイブ

CultureBank: An Online Community-Driven Knowledge Base Towards Culturally Aware Language Technologies

要約 言語モデルの文化的認識を強化するために、さまざまなオンライン コミュニティ … 続きを読む

カテゴリー: cs.AI, cs.CL | CultureBank: An Online Community-Driven Knowledge Base Towards Culturally Aware Language Technologies はコメントを受け付けていません

XFT: Unlocking the Power of Code Instruction Tuning by Simply Merging Upcycled Mixture-of-Experts

要約 アップサイクルされた専門家混合 (MoE) をマージするだけで、命令調整さ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SE | XFT: Unlocking the Power of Code Instruction Tuning by Simply Merging Upcycled Mixture-of-Experts はコメントを受け付けていません

Aligning LLM Agents by Learning Latent Preference from User Edits

要約 私たちは、エージェントの出力に対して行われたユーザー編集に基づいて、言語エ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG | Aligning LLM Agents by Learning Latent Preference from User Edits はコメントを受け付けていません

Visual Grounding Methods for VQA are Working for the Wrong Reasons!

要約 既存のビジュアル質問応答 (VQA) 手法は、正しい理由から正しい答えを生 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Visual Grounding Methods for VQA are Working for the Wrong Reasons! はコメントを受け付けていません

Subobject-level Image Tokenization

要約 トランスフォーマーベースのビジョンモデルは通常、画像を入力単位として固定サ … 続きを読む

カテゴリー: cs.CL, cs.CV | Subobject-level Image Tokenization はコメントを受け付けていません

MedDr: Diagnosis-Guided Bootstrapping for Large-Scale Medical Vision-Language Learning

要約 大規模なビジョン言語モデルの急速な進歩により、さまざまなタスクにわたって驚 … 続きを読む

カテゴリー: cs.CL, cs.CV | MedDr: Diagnosis-Guided Bootstrapping for Large-Scale Medical Vision-Language Learning はコメントを受け付けていません

Re-Thinking Inverse Graphics With Large Language Models

要約 逆グラフィックス (画像を物理変数に反転し、レンダリング時に観察されたシー … 続きを読む

カテゴリー: cs.CL, cs.CV | Re-Thinking Inverse Graphics With Large Language Models はコメントを受け付けていません

VideoXum: Cross-modal Visual and Textural Summarization of Videos

要約 ビデオの要約は、ソースビデオから最も重要な情報を抽出して、要約されたクリッ … 続きを読む

カテゴリー: cs.CL, cs.CV | VideoXum: Cross-modal Visual and Textural Summarization of Videos はコメントを受け付けていません

Automatic Layout Planning for Visually-Rich Documents with Instruction-Following Models

要約 命令追従モデルの最近の進歩により、ユーザーとモデルの対話がよりユーザーフレ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Automatic Layout Planning for Visually-Rich Documents with Instruction-Following Models はコメントを受け付けていません

CT-GLIP: 3D Grounded Language-Image Pretraining with CT Scans and Radiology Reports for Full-Body Scenarios

要約 Medical Vision-Language Pretraining ( … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | CT-GLIP: 3D Grounded Language-Image Pretraining with CT Scans and Radiology Reports for Full-Body Scenarios はコメントを受け付けていません