-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Baichuan-Omni Technical Report
要約 GPT-4o の顕著なマルチモーダル機能とインタラクティブなエクスペリエン … 続きを読む
A Large-scale Interpretable Multi-modality Benchmark for Facial Image Forgery Localization
要約 画像内の改ざんされたピクセルを特定することに重点を置いた画像偽造位置特定は … 続きを読む
A Review on the Integration of Artificial Intelligence and Medical Imaging in IVF Ovarian Stimulation
要約 人工知能 (AI) は、体外受精 (IVF) における意思決定を強化し、治 … 続きを読む
OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis
要約 ビジョン言語モデル (VLM) を活用したグラフィカル ユーザー インター … 続きを読む
LongDocURL: a Comprehensive Multimodal Long Document Benchmark Integrating Understanding, Reasoning, and Locating
要約 ラージ ビジョン言語モデル (LVLM) は文書理解機能を大幅に向上させ、 … 続きを読む
TableRAG: Million-Token Table Understanding with Language Models
要約 言語モデル (LM) の最近の進歩により、主に表を操作および分析するプログ … 続きを読む
ChaI-TeA: A Benchmark for Evaluating Autocompletion of Interactions with LLM-based Chatbots
要約 LLM の台頭により、人間とコンピューターのやり取りの一部が LLM ベー … 続きを読む
SoK: On the Offensive Potential of AI
要約 私たちの社会は人工知能 (AI) の恩恵をますます受けています。 残念なこ … 続きを読む
RDPM: Solve Diffusion Probabilistic Models via Recurrent Token Prediction
要約 拡散確率モデル (DPM) は、高忠実度画像合成の事実上のアプローチとして … 続きを読む
Causal Composition Diffusion Model for Closed-loop Traffic Generation
要約 シミュレーションは、自動運転における安全性評価、特に複雑なインタラクティブ … 続きを読む