-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
The Polar Express: Optimal Matrix Sign Methods and Their Application to the Muon Algorithm
要約 極座標分解とそれに関連する行列符号関数の計算は、数値解析において数十年にわ … 続きを読む
Retrieval-Augmented Generation as Noisy In-Context Learning: A Unified Theory and Risk Bounds
要約 検索支援型生成(RAG)は、外部知識を用いてLLMを支援することで、近年多 … 続きを読む
Critique-GRPO: Advancing LLM Reasoning with Natural Language and Numerical Feedback
要約 スカラー報酬のような数値フィードバックを用いた強化学習(RL)の最近の進歩 … 続きを読む
Entity-Augmented Neuroscience Knowledge Retrieval Using Ontology and Semantic Understanding Capability of LLM
要約 神経科学の研究論文は、膨大な知識の宝庫です。既存の情報を正確に検索し、この … 続きを読む
Causal Estimation of Tokenisation Bias
要約 現代の言語モデルは通常、サブワード列に対して学習されるが、最終的には文字列 … 続きを読む
We Should Chart an Atlas of All the World’s Models
要約 公開モデルリポジトリには、現在数百万ものモデルが含まれていますが、ほとんど … 続きを読む
Can’t See the Forest for the Trees: Benchmarking Multimodal Safety Awareness for Multimodal LLMs
要約 マルチモーダル大規模言語モデル(MLLM)は、テキストと画像の両方を介した … 続きを読む
Chain-of-Jailbreak Attack for Image Generation Models via Editing Step by Step
要約 Stable Diffusion や DALL-E 3 のようなテキストベ … 続きを読む
OmniSpatial: Towards Comprehensive Spatial Reasoning Benchmark for Vision Language Models
要約 空間推論は認知心理学の重要な側面であり、現在の視覚言語モデル(VLM)の大 … 続きを読む
GUI-Actor: Coordinate-Free Visual Grounding for GUI Agents
要約 VLMを搭載したGUIエージェントを構築する際の主な課題の1つは、視覚的グ … 続きを読む