cs.AI」カテゴリーアーカイブ

A Rate-Distortion-Classification Approach for Lossy Image Compression

要約 非可逆画像圧縮では、指定されたビットレートに画像を圧縮しながら、最小限の信 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IT, cs.MM, math.IT | A Rate-Distortion-Classification Approach for Lossy Image Compression はコメントを受け付けていません

Boosting Single Positive Multi-label Classification with Generalized Robust Loss

要約 マルチラベル学習(MLL)は、包括的な多義的注釈を必要とするが、この注釈を … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Boosting Single Positive Multi-label Classification with Generalized Robust Loss はコメントを受け付けていません

Uncovering What, Why and How: A Comprehensive Benchmark for Causation Understanding of Video Anomaly

要約 ビデオ異常理解(VAU)は、ビデオ内の異常発生を自動的に理解することを目的 … 続きを読む

カテゴリー: cs.AI, cs.CV | Uncovering What, Why and How: A Comprehensive Benchmark for Causation Understanding of Video Anomaly はコメントを受け付けていません

RepVGG-GELAN: Enhanced GELAN with VGG-STYLE ConvNets for Brain Tumour Detection

要約 物体検出アルゴリズム、特にYOLOに基づくアルゴリズムは、速度と精度のバラ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | RepVGG-GELAN: Enhanced GELAN with VGG-STYLE ConvNets for Brain Tumour Detection はコメントを受け付けていません

Frozen Transformers in Language Models Are Effective Visual Encoder Layers

要約 本論文は、大規模言語モデル(LLM)が、テキストデータのみで訓練されている … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Frozen Transformers in Language Models Are Effective Visual Encoder Layers はコメントを受け付けていません

SCULPT: Shape-Conditioned Unpaired Learning of Pose-dependent Clothed and Textured Human Meshes

要約 人間の衣服とテクスチャを持つ3Dメッシュのための新しい3D生成モデルSCU … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | SCULPT: Shape-Conditioned Unpaired Learning of Pose-dependent Clothed and Textured Human Meshes はコメントを受け付けていません

MoA: Mixture-of-Attention for Subject-Context Disentanglement in Personalized Image Generation

要約 我々は、Mixture-of-Attention(MoA)と呼ばれる、テキ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | MoA: Mixture-of-Attention for Subject-Context Disentanglement in Personalized Image Generation はコメントを受け付けていません

MemoryMamba: Memory-Augmented State Space Model for Defect Recognition

要約 製造業の自動化が進むにつれて、精密で洗練された欠陥検出技術への需要が高まっ … 続きを読む

カテゴリー: cs.AI, cs.CV | MemoryMamba: Memory-Augmented State Space Model for Defect Recognition はコメントを受け付けていません

Language-Image Models with 3D Understanding

要約 マルチモーダル大規模言語モデル(MLLM)は、様々な2次元視覚と言語タスク … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Language-Image Models with 3D Understanding はコメントを受け付けていません

Wisdom of the Silicon Crowd: LLM Ensemble Prediction Capabilities Rival Human Crowd Accuracy

要約 実際の人間の予測精度は「群衆の知恵」効果に依存しており、将来の事象に関する … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.LG | Wisdom of the Silicon Crowd: LLM Ensemble Prediction Capabilities Rival Human Crowd Accuracy はコメントを受け付けていません