68T10」カテゴリーアーカイブ

What is lost in Normalization? Exploring Pitfalls in Multilingual ASR Model Evaluations

要約 このペーパーでは、特にインド言語の文字に焦点を当てて、多言語自動音声認識 … 続きを読む

カテゴリー: 68T10, 68T50, 91F20, cs.AI, cs.CL, cs.HC, I.2.1 | What is lost in Normalization? Exploring Pitfalls in Multilingual ASR Model Evaluations はコメントを受け付けていません

Nonverbal Immediacy Analysis in Education: A Multimodal Computational Model

要約 この論文では、教育現場における非言語的社会行動を分析するための新しい計算ア … 続きを読む

カテゴリー: 68T10, 68T45, 68U10, 91E45, cs.AI, cs.CV, cs.HC, cs.LG, I.2.10 | Nonverbal Immediacy Analysis in Education: A Multimodal Computational Model はコメントを受け付けていません

Coarse-to-Fine Proposal Refinement Framework for Audio Temporal Forgery Detection and Localization

要約 最近、新しい形式の音声部分偽造がフォレンジックに課題をもたらしており、長時 … 続きを読む

カテゴリー: 68T07, 68T10, cs.CV, cs.MM, cs.SD, eess.AS, I.2 | Coarse-to-Fine Proposal Refinement Framework for Audio Temporal Forgery Detection and Localization はコメントを受け付けていません

Efficient Image Denoising by Low-Rank Singular Vector Approximations of Geodesics’ Gramian Matrix

要約 洗練されたカメラの出現により、高品質の画像を撮影したいという欲求が非常に大 … 続きを読む

カテゴリー: 68T10, 68U10, 94A08, cs.CV, cs.NA, eess.IV, I.4.3, math.NA | Efficient Image Denoising by Low-Rank Singular Vector Approximations of Geodesics’ Gramian Matrix はコメントを受け付けていません

BESTOW: Efficient and Streamable Speech Language Model with the Best of Two Worlds in GPT and T5

要約 音声理解機能を事前トレーニングされた大規模言語モデルに組み込むことは、研究 … 続きを読む

カテゴリー: 68T10, cs.CL, cs.HC, cs.SD, eess.AS, I.2.7 | BESTOW: Efficient and Streamable Speech Language Model with the Best of Two Worlds in GPT and T5 はコメントを受け付けていません

Over-parameterization and Adversarial Robustness in Neural Networks: An Overview and Empirical Analysis

要約 過剰パラメータ化されたニューラル ネットワークは、その広範な容量のおかげで … 続きを読む

カテゴリー: 68T10, cs.LG, I.5 | Over-parameterization and Adversarial Robustness in Neural Networks: An Overview and Empirical Analysis はコメントを受け付けていません

You Need to Pay Better Attention: Rethinking the Mathematics of Attention Mechanism

要約 スケーリング ドット プロダクト アテンション (SDPA) は、多くの最 … 続きを読む

カテゴリー: (Primary), 15A03, 15A04, 68T10, 68T50, cs.AI, cs.CL, cs.CV, cs.LG, I.2.10 | You Need to Pay Better Attention: Rethinking the Mathematics of Attention Mechanism はコメントを受け付けていません

MotionFollower: Editing Video Motion via Lightweight Score-Guided Diffusion

要約 ビデオ属性の変更における拡散ベースのビデオ編集モデルの目覚ましい進歩にもか … 続きを読む

カテゴリー: 68T10, 68T45, cs.CV | MotionFollower: Editing Video Motion via Lightweight Score-Guided Diffusion はコメントを受け付けていません

UNION: Unsupervised 3D Object Detection using Object Appearance-based Pseudo-Classes

要約 教師なし 3D 物体検出手法は、トレーニングに手動ラベルを必要とせずに、膨 … 続きを読む

カテゴリー: 62H35, 68T05, 68T10, 68U10, cs.CV, I.2.10 | UNION: Unsupervised 3D Object Detection using Object Appearance-based Pseudo-Classes はコメントを受け付けていません

From Density to Geometry: YOLOv8 Instance Segmentation for Reverse Engineering of Optimized Structures

要約 このペーパーでは、YOLOv8 インスタンス セグメンテーション モデルを … 続きを読む

カテゴリー: 68T10, cs.CE, cs.CV, I.4.6, secondary | From Density to Geometry: YOLOv8 Instance Segmentation for Reverse Engineering of Optimized Structures はコメントを受け付けていません