月別アーカイブ: 2023年5月

Balancing the Picture: Debiasing Vision-Language Datasets with Synthetic Contrast Sets

要約 画像を大規模に生成、編集、キャプションを付けるための視覚言語モデルの人気が … 続きを読む

カテゴリー: cs.CV | Balancing the Picture: Debiasing Vision-Language Datasets with Synthetic Contrast Sets はコメントを受け付けていません

ChatCoT: Tool-Augmented Chain-of-Thought Reasoning on Chat-based Large Language Models

要約 大規模言語モデル (LLM) はさまざまな評価ベンチマークで優れたパフォー … 続きを読む

カテゴリー: cs.CL | ChatCoT: Tool-Augmented Chain-of-Thought Reasoning on Chat-based Large Language Models はコメントを受け付けていません

Large Language Models are Better Reasoners with Self-Verification

要約 最近、思考連鎖 (CoT) の促進により、GPT-3 などの大規模言語モデ … 続きを読む

カテゴリー: cs.AI, cs.CL | Large Language Models are Better Reasoners with Self-Verification はコメントを受け付けていません

3D Open-vocabulary Segmentation with Foundation Models

要約 3D シーンのオープンボキャブラリーセグメンテーションは人間の知覚の基本的 … 続きを読む

カテゴリー: cs.CV | 3D Open-vocabulary Segmentation with Foundation Models はコメントを受け付けていません

GrACE: Generation using Associated Code Edits

要約 開発者は、バグ修正や新機能の追加など、さまざまな理由でコードの編集にかなり … 続きを読む

カテゴリー: cs.LG, cs.SE | GrACE: Generation using Associated Code Edits はコメントを受け付けていません

Anchor Prediction: Automatic Refinement of Internet Links

要約 インターネット リンクにより、ユーザーは関連情報に簡単にアクセスできるため … 続きを読む

カテゴリー: cs.CL, cs.IR | Anchor Prediction: Automatic Refinement of Internet Links はコメントを受け付けていません

Instruct2Act: Mapping Multi-modality Instructions to Robotic Actions with Large Language Model

要約 基礎モデルは、テキストから画像への生成、パノプティック セグメンテーション … 続きを読む

カテゴリー: cs.AI, cs.RO | Instruct2Act: Mapping Multi-modality Instructions to Robotic Actions with Large Language Model はコメントを受け付けていません

How Old is GPT?: The HumBEL Framework for Evaluating Language Models using Human Demographic Data

要約 大規模な事前トレーニング済み言語モデル (LM) は NLP 全体でより多 … 続きを読む

カテゴリー: cs.AI, cs.CL | How Old is GPT?: The HumBEL Framework for Evaluating Language Models using Human Demographic Data はコメントを受け付けていません

DetGPT: Detect What You Need via Reasoning

要約 近年、大規模言語モデル (LLM) の開発により、コンピューター ビジョン … 続きを読む

カテゴリー: cs.AI, cs.CV | DetGPT: Detect What You Need via Reasoning はコメントを受け付けていません

DUBLIN — Document Understanding By Language-Image Network

要約 視覚的な文書の理解は、文書画像内のテキストと視覚的要素の両方の分析を伴う複 … 続きを読む

カテゴリー: cs.AI, cs.CV, F.2.2 | DUBLIN — Document Understanding By Language-Image Network はコメントを受け付けていません