cs.AI」カテゴリーアーカイブ

Token Dynamics: Towards Efficient and Dynamic Video Token Representation for Video Large Language Models

要約 トークンベースのビデオ表現は、大きな言語モデルがビデオコンテンツを解釈でき … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Token Dynamics: Towards Efficient and Dynamic Video Token Representation for Video Large Language Models はコメントを受け付けていません

SPHINX-X: Scaling Data and Parameters for a Family of Multi-modal Large Language Models

要約 Sphinx-Xは、Sphinxで開発された広範なマルチモダリティ大手言語 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | SPHINX-X: Scaling Data and Parameters for a Family of Multi-modal Large Language Models はコメントを受け付けていません

From 1,000,000 Users to Every User: Scaling Up Personalized Preference for User-level Alignment

要約 大規模な言語モデル(LLM)は、ユーザーの価値とニーズの多様性を根本的に見 … 続きを読む

カテゴリー: cs.AI, cs.CL | From 1,000,000 Users to Every User: Scaling Up Personalized Preference for User-level Alignment はコメントを受け付けていません

Summarization Metrics for Spanish and Basque: Do Automatic Scores and LLM-Judges Correlate with Humans?

要約 自動テキストの要約のための評価メトリックとLLM-As-a-Judgeモデ … 続きを読む

カテゴリー: cs.AI, cs.CL | Summarization Metrics for Spanish and Basque: Do Automatic Scores and LLM-Judges Correlate with Humans? はコメントを受け付けていません

Controlled Low-Rank Adaptation with Subspace Regularization for Continued Training on Large Language Models

要約 大規模な言語モデル(LLM)は、自然言語処理において顕著な能力を示しますが … 続きを読む

カテゴリー: cs.AI, cs.CL | Controlled Low-Rank Adaptation with Subspace Regularization for Continued Training on Large Language Models はコメントを受け付けていません

SATA: A Paradigm for LLM Jailbreak via Simple Assistive Task Linkage

要約 大規模な言語モデル(LLM)は、さまざまなタスクで大きな進歩を遂げています … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR | SATA: A Paradigm for LLM Jailbreak via Simple Assistive Task Linkage はコメントを受け付けていません

Optimizing Attention with Mirror Descent: Generalized Max-Margin Token Selection

要約 注意メカニズムは、自然言語処理やコンピュータービジョンなど、人工知能のいく … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Optimizing Attention with Mirror Descent: Generalized Max-Margin Token Selection はコメントを受け付けていません

Dynamic-LLaVA: Efficient Multimodal Large Language Models via Dynamic Vision-language Context Sparsification

要約 マルチモーダル大手言語モデル(MLLM)は、ビジョン理解、推論、および相互 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Dynamic-LLaVA: Efficient Multimodal Large Language Models via Dynamic Vision-language Context Sparsification はコメントを受け付けていません

OptionZero: Planning with Learned Options

要約 一連の原始的なアクションであるオプションを使用した計画は、複雑な環境内での … 続きを読む

カテゴリー: cs.AI, cs.LG | OptionZero: Planning with Learned Options はコメントを受け付けていません

Temporal-Guided Spiking Neural Networks for Event-Based Human Action Recognition

要約 このペーパーでは、プライバシーを提供する人間の行動認識(HAR)のためのス … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV, cs.NE | Temporal-Guided Spiking Neural Networks for Event-Based Human Action Recognition はコメントを受け付けていません