cs.CL」カテゴリーアーカイブ

Exact Aggregation for Federated and Efficient Fine-Tuning of Foundation Models

要約 低ランク適応 (LoRA) は、基礎モデルを効率的に微調整するための一般的 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.DC | Exact Aggregation for Federated and Efficient Fine-Tuning of Foundation Models はコメントを受け付けていません

MoTe: Learning Motion-Text Diffusion Model for Multiple Generation Tasks

要約 最近、人間の動作分析は、ノイズ除去拡散モデルや大規模言語モデルなどの刺激的 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | MoTe: Learning Motion-Text Diffusion Model for Multiple Generation Tasks はコメントを受け付けていません

A Survey on Multimodal Large Language Models

要約 最近、GPT-4V に代表されるマルチモーダル大規模言語モデル (MLLM … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | A Survey on Multimodal Large Language Models はコメントを受け付けていません

SIMS: Simulating Human-Scene Interactions with Real World Script Planning

要約 長期にわたるヒューマンシーンとシーンのインタラクションをシミュレートするこ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.GR | SIMS: Simulating Human-Scene Interactions with Real World Script Planning はコメントを受け付けていません

On Domain-Specific Post-Training for Multimodal Large Language Models

要約 近年、一般的なマルチモーダル大規模言語モデル (MLLM) の急速な発展が … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | On Domain-Specific Post-Training for Multimodal Large Language Models はコメントを受け付けていません

VLSBench: Unveiling Visual Leakage in Multimodal Safety

要約 マルチモーダル大規模言語モデル (MLLM) の安全性に関する懸念は、さま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.CV | VLSBench: Unveiling Visual Leakage in Multimodal Safety はコメントを受け付けていません

Perception Test 2024: Challenge Summary and a Novel Hour-Long VideoQA Benchmark

要約 2023 年版の成功に続き、最先端のビデオ モデルのベンチマークと測定を目 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Perception Test 2024: Challenge Summary and a Novel Hour-Long VideoQA Benchmark はコメントを受け付けていません

T2Vid: Translating Long Text into Multi-Image is the Catalyst for Video-LLMs

要約 画像領域におけるマルチモーダル大規模言語モデル (MLLM) の成功は、研 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | T2Vid: Translating Long Text into Multi-Image is the Catalyst for Video-LLMs はコメントを受け付けていません

Large Language Model-Brained GUI Agents: A Survey

要約 GUI は長い間、人間とコンピューターの対話の中心であり、デジタル システ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC | Large Language Model-Brained GUI Agents: A Survey はコメントを受け付けていません

Don’t Command, Cultivate: An Exploratory Study of System-2 Alignment

要約 o1 システム カードは、o1 モデルが OpenAI 内で最も堅牢である … 続きを読む

カテゴリー: cs.CL | Don’t Command, Cultivate: An Exploratory Study of System-2 Alignment はコメントを受け付けていません