cs.AI」カテゴリーアーカイブ

Accelerating Codec-based Speech Synthesis with Multi-Token Prediction and Speculative Decoding

要約 この文書の目標は、音声品質の犠牲を最小限に抑えながら、コーデックベースの音 … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Accelerating Codec-based Speech Synthesis with Multi-Token Prediction and Speculative Decoding はコメントを受け付けていません

SimLayerKV: A Simple Framework for Layer-Level KV Cache Reduction

要約 大規模言語モデル (LLM) の最近の進歩により、長いコンテキストを処理で … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | SimLayerKV: A Simple Framework for Layer-Level KV Cache Reduction はコメントを受け付けていません

Towards Multilingual LLM Evaluation for European Languages

要約 大規模言語モデル (LLM) の台頭により、多数の言語やタスクにわたって自 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Towards Multilingual LLM Evaluation for European Languages はコメントを受け付けていません

Influence Functions for Scalable Data Attribution in Diffusion Models

要約 拡散モデルは生成モデリングに大きな進歩をもたらしました。 しかし、それらが … 続きを読む

カテゴリー: cs.AI, cs.LG | Influence Functions for Scalable Data Attribution in Diffusion Models はコメントを受け付けていません

How Numerical Precision Affects Mathematical Reasoning Capabilities of LLMs

要約 Transformer ベースの大規模言語モデル (LLM) はさまざまな … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | How Numerical Precision Affects Mathematical Reasoning Capabilities of LLMs はコメントを受け付けていません

H2OVL-Mississippi Vision Language Models Technical Report

要約 小型ビジョン言語モデル (VLM) は、企業の商業文書や画像を処理するため … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | H2OVL-Mississippi Vision Language Models Technical Report はコメントを受け付けていません

Spatiotemporal Object Detection for Improved Aerial Vehicle Detection in Traffic Monitoring

要約 この研究では、時空間物体検出モデルの開発を通じて、UAV カメラを使用した … 続きを読む

カテゴリー: cs.AI, cs.CV | Spatiotemporal Object Detection for Improved Aerial Vehicle Detection in Traffic Monitoring はコメントを受け付けていません

Diffusion Curriculum: Synthetic-to-Real Generative Curriculum Learning via Image-Guided Diffusion

要約 低品質または希少なデータは、実際にディープ ニューラル ネットワークをトレ … 続きを読む

カテゴリー: cs.AI, cs.CV | Diffusion Curriculum: Synthetic-to-Real Generative Curriculum Learning via Image-Guided Diffusion はコメントを受け付けていません

Comprehensive Performance Evaluation of YOLO11, YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments

要約 この研究では、商業果樹園における緑色の果物の検出のために、YOLOv8、Y … 続きを読む

カテゴリー: cs.AI, cs.CV | Comprehensive Performance Evaluation of YOLO11, YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments はコメントを受け付けていません

EchoApex: A General-Purpose Vision Foundation Model for Echocardiography

要約 心エコー検査の定量的評価は、心臓の状態を正確に評価し、病気の進行を監視し、 … 続きを読む

カテゴリー: cs.AI, cs.CV | EchoApex: A General-Purpose Vision Foundation Model for Echocardiography はコメントを受け付けていません