-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
What We Talk About When We Talk About LMs: Implicit Paradigm Shifts and the Ship of Language Models
要約 言語モデル (LM) という用語は、対象となるモデルの時間固有のコレクショ … 続きを読む
LoRA-Pro: Are Low-Rank Adapters Properly Optimized?
要約 LoRA としても知られる低ランク適応は、基礎モデルをパラメーター効率よく … 続きを読む
A Hitchhiker’s Guide to Scaling Law Estimation
要約 スケーリング則は、より少ないパラメーターまたはより小さなトレーニング セッ … 続きを読む
VisualRWKV-HD and UHD: Advancing High-Resolution Processing for Visual Language Models
要約 複雑な視覚情報を正確に理解することは、視覚言語モデル (VLM) にとって … 続きを読む
Teaching AI Agents to Search with Reflective-MCTS and Exploratory Learning
要約 自律エージェントは、複雑な複数ステップの意思決定タスクを自動化する上で大き … 続きを読む
Magnifier Prompt: Tackling Multimodal Hallucination via Extremely Simple Instructions
要約 マルチモーダル大規模言語モデル (MLLM) における幻覚は、実際の応用を … 続きを読む
Latent Action Pretraining from Videos
要約 グランドトゥルースのロボットアクションラベルを使用せずに視覚言語アクション … 続きを読む
MLLM can see? Dynamic Correction Decoding for Hallucination Mitigation
要約 マルチモーダル大規模言語モデル (MLLM) は頻繁に幻覚現象を示しますが … 続きを読む
TemporalBench: Benchmarking Fine-grained Temporal Understanding for Multimodal Video Models
要約 マルチモーダルビデオの理解と生成には、きめの細かい時間ダイナミクスを理解す … 続きを読む
Will LLMs Replace the Encoder-Only Models in Temporal Relation Classification?
要約 イベント間の時間的関係の自動検出は、主に RoBERTa などのエンコーダ … 続きを読む