cs.AI」カテゴリーアーカイブ

S$^{2}$FT: Efficient, Scalable and Generalizable LLM Fine-tuning by Structured Sparsity

要約 LLM の現在の PEFT メソッドは、高品質で効率的なトレーニング、また … 続きを読む

カテゴリー: cs.AI, cs.LG | S$^{2}$FT: Efficient, Scalable and Generalizable LLM Fine-tuning by Structured Sparsity はコメントを受け付けていません

SoK: Watermarking for AI-Generated Content

要約 生成 AI (GenAI) 技術の出力の品質が向上するにつれて、人間が作成 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.LG | SoK: Watermarking for AI-Generated Content はコメントを受け付けていません

Critical-Questions-of-Thought: Steering LLM reasoning with Argumentative Querying

要約 AI 研究における最近の画期的な急速な進歩にもかかわらず、最先端の大規模言 … 続きを読む

カテゴリー: cs.AI, cs.CL | Critical-Questions-of-Thought: Steering LLM reasoning with Argumentative Querying はコメントを受け付けていません

LongBench v2: Towards Deeper Understanding and Reasoning on Realistic Long-context Multitasks

要約 このペーパーでは、現実世界のマルチタスクにわたる深い理解と推論を必要とする … 続きを読む

カテゴリー: cs.AI, cs.CL | LongBench v2: Towards Deeper Understanding and Reasoning on Realistic Long-context Multitasks はコメントを受け付けていません

SageAttention2: Efficient Attention with Thorough Outlier Smoothing and Per-thread INT4 Quantization

要約 線形層の量子化は広く使用されていますが、アテンションプロセスを加速するため … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.NE, cs.PF | SageAttention2: Efficient Attention with Thorough Outlier Smoothing and Per-thread INT4 Quantization はコメントを受け付けていません

G-VEval: A Versatile Metric for Evaluating Image and Video Captions Using GPT-4o

要約 視覚的なキャプションの評価指標は重要ですが、十分に検討されていません。 B … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | G-VEval: A Versatile Metric for Evaluating Image and Video Captions Using GPT-4o はコメントを受け付けていません

Movie2Story: A framework for understanding videos and telling stories in the form of novel text

要約 マルチモーダルビデオからテキストへのモデルは、主にビデオコンテンツの簡単な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Movie2Story: A framework for understanding videos and telling stories in the form of novel text はコメントを受け付けていません

GIRAFE: Glottal Imaging Dataset for Advanced Segmentation, Analysis, and Facilitative Playbacks Evaluation

要約 声帯の高速ビデオ内視鏡​​シーケンスから抽出された促進的再生の開発の進歩は … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.SD, eess.AS | GIRAFE: Glottal Imaging Dataset for Advanced Segmentation, Analysis, and Facilitative Playbacks Evaluation はコメントを受け付けていません

A Full Transformer-based Framework for Automatic Pain Estimation using Videos

要約 痛みの自動推定は、信頼性の高い評価を提供し、患者の苦痛を軽減する最適な痛み … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | A Full Transformer-based Framework for Automatic Pain Estimation using Videos はコメントを受け付けていません

Jet: A Modern Transformer-Based Normalizing Flow

要約 これまで、生成フローの正規化は、自然画像の生成モデルの有望なクラスとして浮 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Jet: A Modern Transformer-Based Normalizing Flow はコメントを受け付けていません