-
最近の投稿
- 3D Equivariant Visuomotor Policy Learning via Spherical Projection
- Generalization Bounds for Heavy-Tailed SDEs through the Fractional Fokker-Planck Equation
- Statistical Taylor Expansion
- Humans Coexist, So Must Embodied Artificial Agents
- BOPO: Neural Combinatorial Optimization via Best-anchored and Objective-guided Preference Optimization
-
最近のコメント
表示できるコメントはありません。 cs.AI (39070) cs.CL (29554) cs.CV (44473) cs.HC (2974) cs.LG (43974) cs.RO (23299) cs.SY (3561) eess.IV (5120) eess.SY (3553) stat.ML (5712)
「68T45」カテゴリーアーカイブ
AUTHENTICATION: Identifying Rare Failure Modes in Autonomous Vehicle Perception Systems using Adversarially Guided Diffusion Models
要約 自律車両(AVS)は、人工知能(AI)に依存して、オブジェクトを正確に検出 … 続きを読む
Ask2Loc: Learning to Locate Instructional Visual Answers by Asking Questions
要約 指導ビデオ内に特定のセグメントを見つけることは、ガイド知識を習得するための … 続きを読む
Ask2Loc: Learning to Locate Instructional Visual Answers by Asking Questions
要約 指導ビデオ内に特定のセグメントを見つけることは、ガイド知識を習得するための … 続きを読む
Explicit and Implicit Representations in AI-based 3D Reconstruction for Radiology: A systematic literature review
要約 臨床診療と診断支援における高品質の医療イメージングの需要により、放射線イメ … 続きを読む
From Gaze to Insight: Bridging Human Visual Attention and Vision Language Model Explanation for Weakly-Supervised Medical Image Segmentation
要約 医療画像セグメンテーションは、トレーニング用のピクセルレベルの注釈のコスト … 続きを読む
Intelligent Framework for Human-Robot Collaboration: Dynamic Ergonomics and Adaptive Decision-Making
要約 産業環境への共同ロボットの統合により、生産性が向上しましたが、オペレーター … 続きを読む
Hodge Laplacians and Hodge Diffusion Maps
要約 Hodge Diffusion Mapsは、高次元データセットからトポロジ … 続きを読む
SF2T: Self-supervised Fragment Finetuning of Video-LLMs for Fine-Grained Understanding
要約 ビデオベースの大規模な言語モデル(ビデオ-LLM)は、マルチモーダルLLM … 続きを読む
BUFF: Bayesian Uncertainty Guided Diffusion Probabilistic Model for Single Image Super-Resolution
要約 超解像(SR)技術は、特に高解像度画像が不可欠でありながらハードウェアの制 … 続きを読む
Vision-Language Models for Acute Tuberculosis Diagnosis: A Multimodal Approach Combining Imaging and Clinical Data
要約 背景:この研究では、自動化された急性結核(TB)スクリーニングのためのSi … 続きを読む