-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
Can Theoretical Physics Research Benefit from Language Agents?
要約 大規模な言語モデル(LLM)は、多様なドメインで急速に進歩していますが、理 … 続きを読む
PersonaAgent: When Large Language Model Agents Meet Personalization at Test Time
要約 大規模な言語モデル(LLM)エンパワーされたエージェントは最近、幅広いドメ … 続きを読む
Cartridges: Lightweight and general-purpose long context representations via self-study
要約 大規模な言語モデルは、コーパス全体をコンテキストウィンドウに配置し、コンテ … 続きを読む
CLaMR: Contextualized Late-Interaction for Multimodal Content Retrieval
要約 オンラインビデオWebコンテンツは豊富にマルチモーダルです。単一のビデオは … 続きを読む
PuzzleWorld: A Benchmark for Multimodal, Open-Ended Reasoning in Puzzlehunts
要約 Puzzlehuntsは、明確に定義された問題の定義を欠いている複雑でマル … 続きを読む
MimeQA: Towards Socially-Intelligent Nonverbal Foundation Models
要約 AIが人々の日常活動とより密接に統合されるようになるにつれて、日常生活で人 … 続きを読む
Leopard: A Vision Language Model For Text-Rich Multi-Image Tasks
要約 テキストが全体的な理解を導く中心的な視覚要素として機能するテキストが豊富な … 続きを読む
Movie Facts and Fibs (MF$^2$): A Benchmark for Long Movie Understanding
要約 ビジョン言語モデル(VLMS)の最近の進歩にもかかわらず、現在のベンチマー … 続きを読む
Kinetics: Rethinking Test-Time Scaling Laws
要約 実用的な効率の観点からテスト時間のスケーリング法則を再考し、小さなモデルの … 続きを読む
Does It Make Sense to Speak of Introspection in Large Language Models?
要約 大規模な言語モデル(LLM)は、魅力的な言語行動を示し、時には自己報告を提 … 続きを読む