cs.AI」カテゴリーアーカイブ

MuQ: Self-Supervised Music Representation Learning with Mel Residual Vector Quantization

要約 近年、音楽タグ付け、楽器分類、キー検出など、様々な音楽インフォマティクス理 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | MuQ: Self-Supervised Music Representation Learning with Mel Residual Vector Quantization はコメントを受け付けていません

Speech Retrieval-Augmented Generation without Automatic Speech Recognition

要約 音声データに対する質問応答の一般的なアプローチの1つは、まず自動音声認識( … 続きを読む

カテゴリー: cs.AI, cs.CL, eess.AS | Speech Retrieval-Augmented Generation without Automatic Speech Recognition はコメントを受け付けていません

Predicate Invention from Pixels via Pretrained Vision-Language Models

要約 我々の目的は、画像という形の生のセンサー入力が与えられた、変動が激しく、組 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Predicate Invention from Pixels via Pretrained Vision-Language Models はコメントを受け付けていません

Design Optimizer for Soft Growing Robot Manipulators in Three-Dimensional Environments

要約 ソフトグローイングロボットは、散らかった環境や危険な環境でのナビゲーション … 続きを読む

カテゴリー: cs.AI, cs.NE, cs.RO | Design Optimizer for Soft Growing Robot Manipulators in Three-Dimensional Environments はコメントを受け付けていません

H-Net: A Multitask Architecture for Simultaneous 3D Force Estimation and Stereo Semantic Segmentation in Intracardiac Catheters

要約 カテーテル治療の成功率は、外科医に提供される感覚データと密接な関係がある。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, eess.IV | H-Net: A Multitask Architecture for Simultaneous 3D Force Estimation and Stereo Semantic Segmentation in Intracardiac Catheters はコメントを受け付けていません

MSC-Bench: Benchmarking and Analyzing Multi-Sensor Corruption for Driving Perception

要約 マルチセンサーフュージョンモデルは、自律走行知覚、特に3D物体検出やHDマ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | MSC-Bench: Benchmarking and Analyzing Multi-Sensor Corruption for Driving Perception はコメントを受け付けていません

Symmetries-enhanced Multi-Agent Reinforcement Learning

要約 マルチエージェント強化学習は、エージェントが複雑で協調的な行動を学習するた … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.MA, cs.RO, math.RT | Symmetries-enhanced Multi-Agent Reinforcement Learning はコメントを受け付けていません

Risks of Cultural Erasure in Large Language Models

要約 大規模な言語モデルは、検索、オンライン教育、旅行計画など、社会的知識の生産 … 続きを読む

カテゴリー: cs.AI, cs.CL | Risks of Cultural Erasure in Large Language Models はコメントを受け付けていません

MuQ: Self-Supervised Music Representation Learning with Mel Residual Vector Quantization

要約 近年、音楽タグ付け、楽器分類、キー検出など、様々な音楽理解タスクにおいて、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SD, eess.AS | MuQ: Self-Supervised Music Representation Learning with Mel Residual Vector Quantization はコメントを受け付けていません

TED: Turn Emphasis with Dialogue Feature Attention for Emotion Recognition in Conversation

要約 会話における感情認識(ERC)は、複数ターンの文脈をモデル化する手法によっ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | TED: Turn Emphasis with Dialogue Feature Attention for Emotion Recognition in Conversation はコメントを受け付けていません