「cs.CL」カテゴリーアーカイブ

Can Theoretical Physics Research Benefit from Language Agents?

投稿日: 2025年6月9日作成者: jarxiv

要約大規模な言語モデル（LLM）は、多様なドメインで急速に進歩していますが、理 … 続きを読む →

カテゴリー: cs.AI, cs.CL, math-ph, math.MP, quant-ph | コメントを受け付けていません

PersonaAgent: When Large Language Model Agents Meet Personalization at Test Time

投稿日: 2025年6月9日作成者: jarxiv

要約大規模な言語モデル（LLM）エンパワーされたエージェントは最近、幅広いドメ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Cartridges: Lightweight and general-purpose long context representations via self-study

投稿日: 2025年6月9日作成者: jarxiv

要約大規模な言語モデルは、コーパス全体をコンテキストウィンドウに配置し、コンテ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

CLaMR: Contextualized Late-Interaction for Multimodal Content Retrieval

投稿日: 2025年6月9日作成者: jarxiv

要約オンラインビデオWebコンテンツは豊富にマルチモーダルです。単一のビデオは … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.IR | コメントを受け付けていません

PuzzleWorld: A Benchmark for Multimodal, Open-Ended Reasoning in Puzzlehunts

投稿日: 2025年6月9日作成者: jarxiv

要約 Puzzlehuntsは、明確に定義された問題の定義を欠いている複雑でマル … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

MimeQA: Towards Socially-Intelligent Nonverbal Foundation Models

投稿日: 2025年6月9日作成者: jarxiv

要約 AIが人々の日常活動とより密接に統合されるようになるにつれて、日常生活で人 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Leopard: A Vision Language Model For Text-Rich Multi-Image Tasks

投稿日: 2025年6月9日作成者: jarxiv

要約テキストが全体的な理解を導く中心的な視覚要素として機能するテキストが豊富な … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Movie Facts and Fibs (MF$^2$): A Benchmark for Long Movie Understanding

投稿日: 2025年6月9日作成者: jarxiv

要約ビジョン言語モデル（VLMS）の最近の進歩にもかかわらず、現在のベンチマー … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Kinetics: Rethinking Test-Time Scaling Laws

投稿日: 2025年6月9日作成者: jarxiv

要約実用的な効率の観点からテスト時間のスケーリング法則を再考し、小さなモデルの … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Does It Make Sense to Speak of Introspection in Large Language Models?

投稿日: 2025年6月9日作成者: jarxiv

要約大規模な言語モデル（LLM）は、魅力的な言語行動を示し、時には自己報告を提 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

Can Theoretical Physics Research Benefit from Language Agents?

PersonaAgent: When Large Language Model Agents Meet Personalization at Test Time

Cartridges: Lightweight and general-purpose long context representations via self-study

CLaMR: Contextualized Late-Interaction for Multimodal Content Retrieval

PuzzleWorld: A Benchmark for Multimodal, Open-Ended Reasoning in Puzzlehunts

MimeQA: Towards Socially-Intelligent Nonverbal Foundation Models

Leopard: A Vision Language Model For Text-Rich Multi-Image Tasks

Movie Facts and Fibs (MF$^2$): A Benchmark for Long Movie Understanding

Kinetics: Rethinking Test-Time Scaling Laws

Does It Make Sense to Speak of Introspection in Large Language Models?

最近の投稿

最近のコメント

アーカイブ

カテゴリー