cs.AI」カテゴリーアーカイブ

Conformal Predictions for Human Action Recognition with Vision-Language Models

要約 Human-in-the-Loop(HITL)フレームワークは、多くの現実 … 続きを読む

カテゴリー: cs.AI, cs.CV | Conformal Predictions for Human Action Recognition with Vision-Language Models はコメントを受け付けていません

Few-Shot Classification and Anatomical Localization of Tissues in SPECT Imaging

要約 正確な分類と解剖学的局在は、効果的な医療診断と研究に不可欠であり、深い学習 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Few-Shot Classification and Anatomical Localization of Tissues in SPECT Imaging はコメントを受け付けていません

Do generative video models learn physical principles from watching videos?

要約 AIビデオ生成は革命を起こしており、品質とリアリズムが急速に進歩しています … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | Do generative video models learn physical principles from watching videos? はコメントを受け付けていません

CHIRLA: Comprehensive High-resolution Identification and Re-identification for Large-scale Analysis

要約 人の再識別(REID)は、コンピュータービジョンの重要な課題であり、さまざ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | CHIRLA: Comprehensive High-resolution Identification and Re-identification for Large-scale Analysis はコメントを受け付けていません

GHOST: Gaussian Hypothesis Open-Set Technique

要約 大規模な認識方法の評価は、通常、全体的なパフォーマンスに焦点を当てています … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | GHOST: Gaussian Hypothesis Open-Set Technique はコメントを受け付けていません

CleanUMamba: A Compact Mamba Network for Speech Denoising using Channel Pruning

要約 このペーパーでは、生の波形に直接適用されるリアルタイムの因果オーディオ除去 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.SD, eess.AS | CleanUMamba: A Compact Mamba Network for Speech Denoising using Channel Pruning はコメントを受け付けていません

DPD-NeuralEngine: A 22-nm 6.6-TOPS/W/mm$^2$ Recurrent Neural Network Accelerator for Wideband Power Amplifier Digital Pre-Distortion

要約 最新の通信システムにおけるDeep Neural Network(DNN) … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.CV | DPD-NeuralEngine: A 22-nm 6.6-TOPS/W/mm$^2$ Recurrent Neural Network Accelerator for Wideband Power Amplifier Digital Pre-Distortion はコメントを受け付けていません

Grounding Text-to-Image Diffusion Models for Controlled High-Quality Image Generation

要約 テキストからイメージ(T2I)生成拡散モデルは、テキストキャプションから多 … 続きを読む

カテゴリー: cs.AI, cs.CV | Grounding Text-to-Image Diffusion Models for Controlled High-Quality Image Generation はコメントを受け付けていません

Guided and Variance-Corrected Fusion with One-shot Style Alignment for Large-Content Image Generation

要約 小さな拡散モデルを使用して大きな画像を生成すると、大規模なモデルのトレーニ … 続きを読む

カテゴリー: cs.AI, cs.CV | Guided and Variance-Corrected Fusion with One-shot Style Alignment for Large-Content Image Generation はコメントを受け付けていません

KARST: Multi-Kernel Kronecker Adaptation with Re-Scaling Transmission for Visual Classification

要約 特定のタスクの事前訓練を受けたビジョンモデルを微調整することは、コンピュー … 続きを読む

カテゴリー: cs.AI, cs.CV | KARST: Multi-Kernel Kronecker Adaptation with Re-Scaling Transmission for Visual Classification はコメントを受け付けていません