cs.DB」カテゴリーアーカイブ

Croissant: A Metadata Format for ML-Ready Datasets

要約 データは機械学習 (ML) にとって重要なリソースですが、データの操作は依 … 続きを読む

カテゴリー: cs.AI, cs.DB, cs.IR, cs.LG | Croissant: A Metadata Format for ML-Ready Datasets はコメントを受け付けていません

Transformers Meet Relational Databases

要約 Transformer モデルは、表形式データを含む、基礎となるシーケンス … 続きを読む

カテゴリー: cs.DB, cs.LG, H.2.4 | Transformers Meet Relational Databases はコメントを受け付けていません

A Survey of Large Language Model-Based Generative AI for Text-to-SQL: Benchmarks, Applications, Use Cases, and Challenges

要約 Text-to-SQL システムは、自然言語クエリを SQL (Struc … 続きを読む

カテゴリー: cs.AI, cs.DB | A Survey of Large Language Model-Based Generative AI for Text-to-SQL: Benchmarks, Applications, Use Cases, and Challenges はコメントを受け付けていません

DataLab: A Unified Platform for LLM-Powered Business Intelligence

要約 ビジネス インテリジェンス (BI) は、現代の組織内の大量のデータを、情 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DB | DataLab: A Unified Platform for LLM-Powered Business Intelligence はコメントを受け付けていません

Evaluating the Data Model Robustness of Text-to-SQL Systems Based on Real User Queries

要約 Text-to-SQL システム (NL-to-SQL システムとも呼ばれ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DB | Evaluating the Data Model Robustness of Text-to-SQL Systems Based on Real User Queries はコメントを受け付けていません

DataVisT5: A Pre-trained Language Model for Jointly Understanding Text and Data Visualization

要約 データビジュアライゼーション (DV) は、ビッグデータの背後にある洞察を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DB | DataVisT5: A Pre-trained Language Model for Jointly Understanding Text and Data Visualization はコメントを受け付けていません

RSL-SQL: Robust Schema Linking in Text-to-SQL Generation

要約 Text-to-SQL 生成は、自然言語の質問を SQL ステートメントに … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DB | RSL-SQL: Robust Schema Linking in Text-to-SQL Generation はコメントを受け付けていません

Distributed, communication-efficient, and differentially private estimation of KL divergence

要約 分散された機密データを管理する際の重要なタスクは、分散がどの程度変化するか … 続きを読む

カテゴリー: cs.DB, cs.LG | Distributed, communication-efficient, and differentially private estimation of KL divergence はコメントを受け付けていません

FineWeb-zhtw: Scalable Curation of Traditional Chinese Text Data from the Web

要約 事前トレーニング データセットの品質とサイズは、大規模言語モデル (LLM … 続きを読む

カテゴリー: cs.CL, cs.DB | FineWeb-zhtw: Scalable Curation of Traditional Chinese Text Data from the Web はコメントを受け付けていません

HoneyBee: A Scalable Modular Framework for Creating Multimodal Oncology Datasets with Foundational Embedding Models

要約 腫瘍学向けの正確な機械学習モデルを開発するには、大規模で高品質のマルチモー … 続きを読む

カテゴリー: cs.AI, cs.DB, cs.LG | HoneyBee: A Scalable Modular Framework for Creating Multimodal Oncology Datasets with Foundational Embedding Models はコメントを受け付けていません