-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Semantically Diverse Language Generation for Uncertainty Estimation in Language Models
要約 大規模言語モデル (LLM) は、テキストを生成するときに幻覚に悩まされる … 続きを読む
Chimera: Effectively Modeling Multivariate Time Series with 2-Dimensional State Space Models
要約 多変量時系列のモデリングは、医療から金融市場まで幅広いアプリケーションで確 … 続きを読む
PaCE: Parsimonious Concept Engineering for Large Language Models
要約 大規模言語モデル (LLM) は、さまざまなタスクに使用されています。 こ … 続きを読む
The Revolution of Multimodal Large Language Models: A Survey
要約 テキストとビジュアルモダリティを結び付けることは、生成知能において重要な役 … 続きを読む
Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection
要約 非常に低電力のデバイス上で機械学習アプリケーションを可能にする Tiny … 続きを読む
M3LEO: A Multi-Modal, Multi-Label Earth Observation Dataset Integrating Interferometric SAR and RGB Data
要約 衛星ベースのリモート センシングは、急速に進化する世界で地球規模の課題に対 … 続きを読む
GeoGen: Geometry-Aware Generative Modeling via Signed Distance Functions
要約 単一ビューのコレクションから 3D ジオメトリと画像を合成するための新しい … 続きを読む
MLVU: A Comprehensive Benchmark for Multi-Task Long Video Understanding
要約 Long Video Understanding (LVU) パフォーマン … 続きを読む
ELFS: Enhancing Label-Free Coreset Selection via Clustering-based Pseudo-Labeling
要約 最新の深層学習パイプラインには人間による注釈が付けられた高品質のデータが不 … 続きを読む
Vision-LSTM: xLSTM as Generic Vision Backbone
要約 トランスフォーマーは、当初は自然言語処理のために導入されたにもかかわらず、 … 続きを読む