-
最近の投稿
- Learning to Recover: Dynamic Reward Shaping with Wheel-Leg Coordination for Fallen Robots
- An Integrated Visual Servoing Framework for Precise Robotic Pruning Operations in Modern Commercial Orchard
- Adaptive Locomotion on Mud through Proprioceptive Sensing of Substrate Properties
- TD-TOG Dataset: Benchmarking Zero-Shot and One-Shot Task-Oriented Grasping for Object Generalization
- Hierarchical Intention-Aware Expressive Motion Generation for Humanoid Robots
-
最近のコメント
表示できるコメントはありません。 cs.AI (39326) cs.CL (29768) cs.CV (44705) cs.HC (2997) cs.LG (44251) cs.RO (23494) cs.SY (3583) eess.IV (5135) eess.SY (3575) stat.ML (5752)
「I.2.10」カテゴリーアーカイブ
Transformers Get Stable: An End-to-End Signal Propagation Theory for Language Models
要約 変圧器モデルは大成功を収めているにもかかわらず、依然として詳細に拡張するこ … 続きを読む
TaylorShift: Shifting the Complexity of Self-Attention from Squared to Linear (and Back) using Taylor-Softmax
要約 アテンション メカニズムの 2 次の複雑さは、Transformer を使 … 続きを読む
Extracting Training Data from Document-Based VQA Models
要約 ビジョン言語モデル (VLM) は、ドキュメントベースの視覚的な質問応答 … 続きを読む
Optimizing the image correction pipeline for pedestrian detection in the thermal-infrared domain
要約 赤外線画像は、霧や低照度シナリオのような視認性の低い状況で役立ちますが、熱 … 続きを読む
SH17: A Dataset for Human Safety and Personal Protective Equipment Detection in Manufacturing Industry
要約 労働災害は、特に建設業や製造業などの産業において、人の安全にとって重大なリ … 続きを読む
Semi-Supervised Segmentation via Embedding Matching
要約 深層畳み込みニューラルネットワークは、医用画像のセグメンテーションに広く使 … 続きを読む
Unified Auto-Encoding with Masked Diffusion
要約 成功した生成表現学習モデルと自己教師あり表現学習モデルの両方の中核には、何 … 続きを読む
μ-Net: A Deep Learning-Based Architecture for μ-CT Segmentation
要約 X 線コンピューターマイクロトモグラフィー ({\μ}-CT) は、医療サ … 続きを読む
Tri-VQA: Triangular Reasoning Medical Visual Question Answering for Multi-Attribute Analysis
要約 Medical Visual Question Answering (Me … 続きを読む