-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
VideoEspresso: A Large-Scale Chain-of-Thought Dataset for Fine-Grained Video Reasoning via Core Frame Selection
要約 Large Vision Language Models (LVLM) の … 続きを読む
Continual SFT Matches Multimodal RLHF with Negative Supervision
要約 マルチモーダル RLHF は通常、視覚言語モデル (VLM) の理解を継続 … 続きを読む
Self-Training Meets Consistency: Improving LLMs’ Reasoning With Consistency-Driven Rationale Evaluation
要約 大規模言語モデル (LLM) の自己トレーニング アプローチは、自己生成さ … 続きを読む
VisGraphVar: A Benchmark Generator for Assessing Variability in Graph Analysis Using Large Vision-Language Models
要約 Large Vision-Language Model (LVLM) の急 … 続きを読む
From Novice to Expert: LLM Agent Policy Optimization via Step-wise Reinforcement Learning
要約 大規模言語モデル (LLM) の優れた機能により、LLM はさまざまな自律 … 続きを読む
Bone: Block-Affine Adaptation of Large Language Models
要約 低ランク適応 (LoRA) は、元の重みを凍結し、低ランクの行列のみをトレ … 続きを読む
GTA: A Benchmark for General Tool Agents
要約 汎用エージェントの開発では、大規模言語モデル (LLM) とさまざまなツー … 続きを読む
Prioritize Denoising Steps on Diffusion Model Preference Alignment via Explicit Denoised Distribution Estimation
要約 拡散モデルはテキストから画像への生成において目覚ましい成功を収めており、こ … 続きを読む
Automatic Design of Semantic Similarity Ensembles Using Grammatical Evolution
要約 意味的類似性の尺度は、さまざまなコンピューター関連のタスクを促進するために … 続きを読む
DAIRHuM: A Platform for Directly Aligning AI Representations with Human Musical Judgments applied to Carnatic Music
要約 音楽 AI モデルの表現を定量化し、人間の行動と一致させることは、MIR … 続きを読む