月別アーカイブ: 2023年5月

A Comprehensive Review of YOLO: From YOLOv1 and Beyond

要約 YOLO は、ロボット工学、無人自動車、およびビデオ監視アプリケーションの … 続きを読む

カテゴリー: cs.CV | A Comprehensive Review of YOLO: From YOLOv1 and Beyond はコメントを受け付けていません

RxnScribe: A Sequence Generation Model for Reaction Diagram Parsing

要約 反応図の解析は、化学文献の図から反応スキームを抽出するタスクです。 反応図 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | RxnScribe: A Sequence Generation Model for Reaction Diagram Parsing はコメントを受け付けていません

Any-to-Any Generation via Composable Diffusion

要約 我々は、入力モダリティの任意の組み合わせから、言語、画像、ビデオ、オーディ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.SD, eess.AS | Any-to-Any Generation via Composable Diffusion はコメントを受け付けていません

Video Killed the HD-Map: Predicting Driving Behavior Directly From Drone Images

要約 人間のデモンストレーションを使用して行動運転モデル​​を学習するアルゴリズ … 続きを読む

カテゴリー: cs.CV, cs.RO, I.2.9 | Video Killed the HD-Map: Predicting Driving Behavior Directly From Drone Images はコメントを受け付けていません

Benchmarking White Blood Cell Classification Under Domain Shift

要約 人間の血液塗抹標本の顕微鏡画像で白血球 (WBC) の種類を認識することは … 続きを読む

カテゴリー: cs.CV, eess.IV | Benchmarking White Blood Cell Classification Under Domain Shift はコメントを受け付けていません

Chupa: Carving 3D Clothed Humans from Skinned Shape Priors using 2D Diffusion Probabilistic Models

要約 私たちは、拡散モデルを使用して現実的な人間のデジタル アバターを生成する … 続きを読む

カテゴリー: cs.CV | Chupa: Carving 3D Clothed Humans from Skinned Shape Priors using 2D Diffusion Probabilistic Models はコメントを受け付けていません

SpeechGPT: Empowering Large Language Models with Intrinsic Cross-Modal Conversational Abilities

要約 マルチモーダル大規模言語モデルは、汎用人工知能 (AGI) に向けた重要な … 続きを読む

カテゴリー: cs.CL | SpeechGPT: Empowering Large Language Models with Intrinsic Cross-Modal Conversational Abilities はコメントを受け付けていません

Causal Document-Grounded Dialogue Pre-training

要約 文書に基づいた対話 (DocGD) の目標は、対話の文脈に従って裏付けとな … 続きを読む

カテゴリー: cs.CL | Causal Document-Grounded Dialogue Pre-training はコメントを受け付けていません

Making More of Little Data: Improving Low-Resource Automatic Speech Recognition Using Data Augmentation

要約 自動音声認識 (ASR) システムのパフォーマンスは、近年、特に大量の音声 … 続きを読む

カテゴリー: cs.CL, eess.AS | Making More of Little Data: Improving Low-Resource Automatic Speech Recognition Using Data Augmentation はコメントを受け付けていません

Taxonomy Completion with Probabilistic Scorer via Box Embedding

要約 分類の完成は、既存の分類を新しい概念で自動的に充実させることを目的としたタ … 続きを読む

カテゴリー: cs.CL | Taxonomy Completion with Probabilistic Scorer via Box Embedding はコメントを受け付けていません