-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
ChatGPT Needs SPADE (Sustainability, PrivAcy, Digital divide, and Ethics) Evaluation: A Review
要約 ChatGPT は、消費者がデバイスで広く利用できるもう 1 つの大規模言 … 続きを読む
Explainable Artificial Intelligence: A Survey of Needs, Techniques, Applications, and Future Direction
要約 人工知能モデルは、そのブラックボックスの性質により、特に医療、金融、自動運 … 続きを読む
ViSoLex: An Open-Source Repository for Vietnamese Social Media Lexical Normalization
要約 ViSoLex は、ベトナム語ソーシャル メディア テキストの語彙正規化と … 続きを読む
HADES: Hardware Accelerated Decoding for Efficient Speculation in Large Language Models
要約 大規模言語モデル (LLM) は、人間のようなテキストを理解して生成するこ … 続きを読む
MLLM-CompBench: A Comparative Reasoning Benchmark for Multimodal LLMs
要約 物体、シーン、または状況を比較する能力は、日常生活における効果的な意思決定 … 続きを読む
Step-by-Step Mastery: Enhancing Soft Constraint Following Ability of Large Language Models
要約 大規模言語モデル (LLM) にとって、複数の制約を含む命令に従うことが重 … 続きを読む
Critical Tokens Matter: Token-Level Contrastive Estimation Enhances LLM’s Reasoning Capability
要約 数学的推論タスクは、正確な論理演繹とシーケンス分析を必要とするため、大規模 … 続きを読む
AdaCS: Adaptive Normalization for Enhanced Code-Switching ASR
要約 センテンシャル内コードスイッチング (CS) は、単一の発話内で発生する言 … 続きを読む
MIO: A Foundation Model on Multimodal Tokens
要約 このペーパーでは、エンドツーエンドの自己回帰方式で音声、テキスト、画像、ビ … 続きを読む
Quilt-LLaVA: Visual Instruction Tuning by Extracting Localized Narratives from Open-Source Histopathology Videos
要約 組織病理学における診断には、グローバルな全スライド画像 (WSI) 解析が … 続きを読む