-
最近の投稿
- Learning to Drive Anywhere with Model-Based Reannotation11
- KineSoft: Learning Proprioceptive Manipulation Policies with Soft Robot Hands
- CityNavAgent: Aerial Vision-and-Language Navigation with Hierarchical Semantic Planning and Global Memory
- Closing the Loop: Motion Prediction Models beyond Open-Loop Benchmarks
- Adaptive Stress Testing Black-Box LLM Planners
-
最近のコメント
表示できるコメントはありません。 cs.AI (37890) cs.CL (28643) cs.CV (43507) cs.HC (2900) cs.LG (42826) cs.RO (22521) cs.SY (3457) eess.IV (5045) eess.SY (3449) stat.ML (5583)
「68T10」カテゴリーアーカイブ
Nonverbal Immediacy Analysis in Education: A Multimodal Computational Model
要約 この論文では、教育現場における非言語的社会行動を分析するための新しい計算ア … 続きを読む
Coarse-to-Fine Proposal Refinement Framework for Audio Temporal Forgery Detection and Localization
要約 最近、新しい形式の音声部分偽造がフォレンジックに課題をもたらしており、長時 … 続きを読む
Efficient Image Denoising by Low-Rank Singular Vector Approximations of Geodesics’ Gramian Matrix
要約 洗練されたカメラの出現により、高品質の画像を撮影したいという欲求が非常に大 … 続きを読む
BESTOW: Efficient and Streamable Speech Language Model with the Best of Two Worlds in GPT and T5
要約 音声理解機能を事前トレーニングされた大規模言語モデルに組み込むことは、研究 … 続きを読む
Over-parameterization and Adversarial Robustness in Neural Networks: An Overview and Empirical Analysis
要約 過剰パラメータ化されたニューラル ネットワークは、その広範な容量のおかげで … 続きを読む
You Need to Pay Better Attention: Rethinking the Mathematics of Attention Mechanism
要約 スケーリング ドット プロダクト アテンション (SDPA) は、多くの最 … 続きを読む
MotionFollower: Editing Video Motion via Lightweight Score-Guided Diffusion
要約 ビデオ属性の変更における拡散ベースのビデオ編集モデルの目覚ましい進歩にもか … 続きを読む
UNION: Unsupervised 3D Object Detection using Object Appearance-based Pseudo-Classes
要約 教師なし 3D 物体検出手法は、トレーニングに手動ラベルを必要とせずに、膨 … 続きを読む
From Density to Geometry: YOLOv8 Instance Segmentation for Reverse Engineering of Optimized Structures
要約 このペーパーでは、YOLOv8 インスタンス セグメンテーション モデルを … 続きを読む