-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Accelerating Codec-based Speech Synthesis with Multi-Token Prediction and Speculative Decoding
要約 この文書の目標は、音声品質の犠牲を最小限に抑えながら、コーデックベースの音 … 続きを読む
SimLayerKV: A Simple Framework for Layer-Level KV Cache Reduction
要約 大規模言語モデル (LLM) の最近の進歩により、長いコンテキストを処理で … 続きを読む
Towards Multilingual LLM Evaluation for European Languages
要約 大規模言語モデル (LLM) の台頭により、多数の言語やタスクにわたって自 … 続きを読む
Influence Functions for Scalable Data Attribution in Diffusion Models
要約 拡散モデルは生成モデリングに大きな進歩をもたらしました。 しかし、それらが … 続きを読む
How Numerical Precision Affects Mathematical Reasoning Capabilities of LLMs
要約 Transformer ベースの大規模言語モデル (LLM) はさまざまな … 続きを読む
H2OVL-Mississippi Vision Language Models Technical Report
要約 小型ビジョン言語モデル (VLM) は、企業の商業文書や画像を処理するため … 続きを読む
Spatiotemporal Object Detection for Improved Aerial Vehicle Detection in Traffic Monitoring
要約 この研究では、時空間物体検出モデルの開発を通じて、UAV カメラを使用した … 続きを読む
Diffusion Curriculum: Synthetic-to-Real Generative Curriculum Learning via Image-Guided Diffusion
要約 低品質または希少なデータは、実際にディープ ニューラル ネットワークをトレ … 続きを読む
Comprehensive Performance Evaluation of YOLO11, YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments
要約 この研究では、商業果樹園における緑色の果物の検出のために、YOLOv8、Y … 続きを読む
EchoApex: A General-Purpose Vision Foundation Model for Echocardiography
要約 心エコー検査の定量的評価は、心臓の状態を正確に評価し、病気の進行を監視し、 … 続きを読む