cs.AI」カテゴリーアーカイブ

DPD-NeuralEngine: A 22-nm 6.6-TOPS/W/mm$^2$ Recurrent Neural Network Accelerator for Wideband Power Amplifier Digital Pre-Distortion

要約 最新の通信システムではディープ ニューラル ネットワーク (DNN) ベー … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.CV | DPD-NeuralEngine: A 22-nm 6.6-TOPS/W/mm$^2$ Recurrent Neural Network Accelerator for Wideband Power Amplifier Digital Pre-Distortion はコメントを受け付けていません

U-MedSAM: Uncertainty-aware MedSAM for Medical Image Segmentation

要約 Medical Image Foundation Model は、さまざま … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | U-MedSAM: Uncertainty-aware MedSAM for Medical Image Segmentation はコメントを受け付けていません

MLLM can see? Dynamic Correction Decoding for Hallucination Mitigation

要約 マルチモーダル大規模言語モデル (MLLM) は頻繁に幻覚現象を示しますが … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | MLLM can see? Dynamic Correction Decoding for Hallucination Mitigation はコメントを受け付けていません

OKAMI: Teaching Humanoid Robots Manipulation Skills through Single Video Imitation

要約 私たちは、単一のビデオデモンストレーションを模倣して人型ロボットの操作スキ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | OKAMI: Teaching Humanoid Robots Manipulation Skills through Single Video Imitation はコメントを受け付けていません

VIA: Unified Spatiotemporal Video Adaptation Framework for Global and Local Video Editing

要約 ビデオ編集は、エンターテインメントや教育からプロフェッショナルなコミュニケ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | VIA: Unified Spatiotemporal Video Adaptation Framework for Global and Local Video Editing はコメントを受け付けていません

MoH: Multi-Head Attention as Mixture-of-Head Attention

要約 この作業では、Transformer モデルの中核であるマルチヘッド アテ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | MoH: Multi-Head Attention as Mixture-of-Head Attention はコメントを受け付けていません

TemporalBench: Benchmarking Fine-grained Temporal Understanding for Multimodal Video Models

要約 マルチモーダルビデオの理解と生成には、きめの細かい時間ダイナミクスを理解す … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | TemporalBench: Benchmarking Fine-grained Temporal Understanding for Multimodal Video Models はコメントを受け付けていません

Learning Quadruped Locomotion Using Differentiable Simulation

要約 この研究では、四足歩行の学習に微分可能なシミュレーションを使用する可能性を … 続きを読む

カテゴリー: cs.AI, cs.RO | Learning Quadruped Locomotion Using Differentiable Simulation はコメントを受け付けていません

Make the Pertinent Salient: Task-Relevant Reconstruction for Visual Control with Distractions

要約 モデルベース強化学習 (MBRL) の最近の進歩により、MBRL は視覚的 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Make the Pertinent Salient: Task-Relevant Reconstruction for Visual Control with Distractions はコメントを受け付けていません

Input-to-State Stable Coupled Oscillator Networks for Closed-form Model-based Control in Latent Space

要約 文献ではさまざまな方法が提案されていますが、物理システムの効率的かつ効果的 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO, cs.SY, eess.SY | Input-to-State Stable Coupled Oscillator Networks for Closed-form Model-based Control in Latent Space はコメントを受け付けていません