-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
MoWE-Audio: Multitask AudioLLMs with Mixture of Weak Encoders
要約 大規模言語モデル (LLM) の急速な進歩により、自然言語処理機能が大幅に … 続きを読む
LLaMA-Omni: Seamless Speech Interaction with Large Language Models
要約 GPT-4o のようなモデルは、音声による大規模言語モデル (LLM) と … 続きを読む
Insuring Uninsurable Risks from AI: The State as Insurer of Last Resort
要約 多くの専門家は、AI システムは遅かれ早かれ、存続リスクを含む保険不可能な … 続きを読む
Liability and Insurance for Catastrophic Losses: the Nuclear Power Precedent and Lessons for AI
要約 AI システムがより自律的かつ高機能になるにつれ、専門家は、AI システム … 続きを読む
Benchmarking Sub-Genre Classification For Mainstage Dance Music
要約 音楽の分類は、幅広い用途に対応しており、音楽情報の検索において最も重要なタ … 続きを読む
Geometric-Averaged Preference Optimization for Soft Preference Labels
要約 LLM を人間の好みに合わせるためのアルゴリズムの多くは、人間の好みが二値 … 続きを読む
HybridFC: A Hybrid Fact-Checking Approach for Knowledge Graphs
要約 ナレッジ グラフ内のアサーションの真実性を予測することを目的としたファクト … 続きを読む
VITA: Towards Open-Source Interactive Omni Multimodal LLM
要約 GPT-4o の優れたマルチモーダル機能とインタラクティブなエクスペリエン … 続きを読む
Aligning Machine and Human Visual Representations across Abstraction Levels
要約 ディープ ニューラル ネットワークは、視覚タスクにおける人間の行動のモデル … 続きを読む
Extending 6D Object Pose Estimators for Stereo Vision
要約 オブジェクトの 6D 姿勢を正確、迅速、かつ確実に推定することは、依然とし … 続きを読む