cs.AI」カテゴリーアーカイブ

Static IR Drop Prediction with Attention U-Net and Saliency-Based Explainability

要約 最近、ニューラル ネットワークを使用した静的 IR ドロップ解析と、画像間 … 続きを読む

カテゴリー: cs.AI, cs.AR | Static IR Drop Prediction with Attention U-Net and Saliency-Based Explainability はコメントを受け付けていません

KaPO: Knowledge-aware Preference Optimization for Controllable Knowledge Selection in Retrieval-Augmented Language Models

要約 外部知識を統合することにより、検索拡張生成 (RAG) は、知識集約型タス … 続きを読む

カテゴリー: cs.AI, cs.CL | KaPO: Knowledge-aware Preference Optimization for Controllable Knowledge Selection in Retrieval-Augmented Language Models はコメントを受け付けていません

Understanding How Blind Users Handle Object Recognition Errors: Strategies and Challenges

要約 物体認識テクノロジーは、目の見えない人や弱視の人が周囲の世界を移動できるよ … 続きを読む

カテゴリー: cs.AI, cs.HC | Understanding How Blind Users Handle Object Recognition Errors: Strategies and Challenges はコメントを受け付けていません

Training LLMs to Recognize Hedges in Spontaneous Narratives

要約 ヘッジを使用すると、話者は、非原型性または「あいまいさ」を示すかどうか、発 … 続きを読む

カテゴリー: cs.AI, cs.CL, I.2.7 | Training LLMs to Recognize Hedges in Spontaneous Narratives はコメントを受け付けていません

MoMa: Efficient Early-Fusion Pre-training with Mixture of Modality-Aware Experts

要約 混合モーダルの初期融合言語モデルを事前トレーニングするために設計された、新 … 続きを読む

カテゴリー: cs.AI, cs.LG | MoMa: Efficient Early-Fusion Pre-training with Mixture of Modality-Aware Experts はコメントを受け付けていません

FBSDiff: Plug-and-Play Frequency Band Substitution of Diffusion Features for Highly Controllable Text-Driven Image Translation

要約 大規模なテキストから画像への拡散モデルは、生成 AI とマルチモーダル テ … 続きを読む

カテゴリー: cs.AI, cs.CV | FBSDiff: Plug-and-Play Frequency Band Substitution of Diffusion Features for Highly Controllable Text-Driven Image Translation はコメントを受け付けていません

Dilated Convolution with Learnable Spacings makes visual models more aligned with humans: a Grad-CAM study

要約 Dirated Convolution with Learningable … 続きを読む

カテゴリー: cs.AI, cs.CV | Dilated Convolution with Learnable Spacings makes visual models more aligned with humans: a Grad-CAM study はコメントを受け付けていません

Personalizing Federated Instrument Segmentation with Visual Trait Priors in Robotic Surgery

要約 手術器具セグメンテーション (SIS) のためのパーソナライズされたフェデ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO, physics.med-ph | Personalizing Federated Instrument Segmentation with Visual Trait Priors in Robotic Surgery はコメントを受け付けていません

VCHAR:Variance-Driven Complex Human Activity Recognition framework with Generative Representation

要約 複雑な人間活動認識 (CHAR) は、ユビキタス コンピューティング、特に … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, eess.SP | VCHAR:Variance-Driven Complex Human Activity Recognition framework with Generative Representation はコメントを受け付けていません

GAOKAO-MM: A Chinese Human-Level Benchmark for Multimodal Models Evaluation

要約 Large Vision-Language Model (LVLM) は、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | GAOKAO-MM: A Chinese Human-Level Benchmark for Multimodal Models Evaluation はコメントを受け付けていません