cs.CL」カテゴリーアーカイブ

Contextual ASR Error Handling with LLMs Augmentation for Goal-Oriented Conversational AI

要約 汎用の自動音声認識 (ASR) システムは、目標指向の対話では必ずしもうま … 続きを読む

カテゴリー: cs.AI, cs.CL | Contextual ASR Error Handling with LLMs Augmentation for Goal-Oriented Conversational AI はコメントを受け付けていません

GeoX: Geometric Problem Solving Through Unified Formalized Vision-Language Pre-training

要約 マルチモーダル大規模言語モデル (MLLM) は、一般的なタスクには習熟し … 続きを読む

カテゴリー: cs.CL, cs.CV | GeoX: Geometric Problem Solving Through Unified Formalized Vision-Language Pre-training はコメントを受け付けていません

Dolphin: Closed-loop Open-ended Auto-research through Thinking, Practice, and Feedback

要約 科学研究のパラダイムは、人工知能 (AI) の発展により大きな変革を迎えて … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Dolphin: Closed-loop Open-ended Auto-research through Thinking, Practice, and Feedback はコメントを受け付けていません

Scalable Vision Language Model Training via High Quality Data Curation

要約 このペーパーでは、2B パラメータを備えた最先端 (SOTA) パフォーマ … 続きを読む

カテゴリー: cs.CL, cs.CV | Scalable Vision Language Model Training via High Quality Data Curation はコメントを受け付けていません

Benchmark Evaluations, Applications, and Challenges of Large Vision Language Models: A Survey

要約 マルチモーダル ビジョン ランゲージ モデル (VLM) は、コンピュータ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | Benchmark Evaluations, Applications, and Challenges of Large Vision Language Models: A Survey はコメントを受け付けていません

SensorQA: A Question Answering Benchmark for Daily-Life Monitoring

要約 センサーデータの急速な増加に伴い、人間が理解できる方法でこれらのデータを効 … 続きを読む

カテゴリー: cs.AI, cs.CL | SensorQA: A Question Answering Benchmark for Daily-Life Monitoring はコメントを受け付けていません

A General Retrieval-Augmented Generation Framework for Multimodal Case-Based Reasoning Applications

要約 ケースベース推論 (CBR) は、問題解決に対する経験ベースのアプローチで … 続きを読む

カテゴリー: cs.AI, cs.CL | A General Retrieval-Augmented Generation Framework for Multimodal Case-Based Reasoning Applications はコメントを受け付けていません

More is not always better? Enhancing Many-Shot In-Context Learning with Differentiated and Reweighting Objectives

要約 大規模言語モデル (LLM) は、パラメーターの更新を必要とせず、数ショッ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | More is not always better? Enhancing Many-Shot In-Context Learning with Differentiated and Reweighting Objectives はコメントを受け付けていません

FLowHigh: Towards Efficient and High-Quality Audio Super-Resolution with Single-Step Flow Matching

要約 オーディオの超解像度は、その不適切な性質により困難を伴います。 最近、オー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | FLowHigh: Towards Efficient and High-Quality Audio Super-Resolution with Single-Step Flow Matching はコメントを受け付けていません

Investigating Numerical Translation with Large Language Models

要約 数値の変換が不正確だと、経済的損失から医療上の不正確さに至るまで、重大なセ … 続きを読む

カテゴリー: cs.CL | Investigating Numerical Translation with Large Language Models はコメントを受け付けていません