-
最近の投稿
- Experimental Study on The Effect of Multi-step Deep Reinforcement Learning in POMDPs
- AutoLoop: Fast Visual SLAM Fine-tuning through Agentic Curriculum Learning
- Embodied Scene Understanding for Vision Language Models via MetaVQA
- Estimation-Aware Trajectory Optimization with Set-Valued Measurement Uncertainties
- Combining Movement Primitives with Contraction Theory
-
最近のコメント
表示できるコメントはありません。 cs.AI (32387) cs.CL (24483) cs.CR (2509) cs.CV (38599) cs.LG (37256) cs.RO (18883) cs.SY (2886) eess.IV (4625) eess.SY (2880) stat.ML (4916)
投稿者「jarxiv」のアーカイブ
A design of Convolutional Neural Network model for the Diagnosis of the COVID-19
要約 過去 1 年間で新型コロナウイルス感染症が世界中に拡大したため、人工知能 … 続きを読む
CityLoc: 6 DoF Localization of Text Descriptions in Large-Scale Scenes with Gaussian Representation
要約 大規模な 3D シーンでのテキスト説明のローカライズは、本質的にあいまいな … 続きを読む
CityDreamer4D: Compositional Generative Model of Unbounded 4D Cities
要約 3D シーンの生成は近年ますます注目を集めており、大きな進歩を遂げています … 続きを読む
SA-MLP: A Low-Power Multiplication-Free Deep Network for 3D Point Cloud Classification in Resource-Constrained Environments
要約 点群分類は、自動運転車、ロボット工学、環境モニタリングなどのアプリケーショ … 続きを読む
RepVideo: Rethinking Cross-Layer Representation for Video Generation
要約 ビデオ生成は拡散モデルの導入により目覚ましい進歩を遂げ、生成されるビデオの … 続きを読む
A General Framework for Inference-time Scaling and Steering of Diffusion Models
要約 拡散モデルは、画像やビデオからタンパク質の設計やテキストに至るまで、さまざ … 続きを読む
Click-Calib: A Robust Extrinsic Calibration Method for Surround-View Systems
要約 サラウンドビュー システム (SVS) は、先進運転支援システム (ADA … 続きを読む
Vision Foundation Models for Computed Tomography
要約 財団モデル (FM) は、画像診断モダリティ全体で多様で複雑なタスクを実行 … 続きを読む
DeblurDiNAT: A Compact Model with Exceptional Generalization and Visual Fidelity on Unseen Domains
要約 最近のブレ除去ネットワークは、ぼやけた画像から鮮明な画像を効果的に復元しま … 続きを読む
SimGen: A Diffusion-Based Framework for Simultaneous Surgical Image and Segmentation Mask Generation
要約 外科データの取得と注釈付けは多くの場合、リソースを大量に消費し、倫理的な制 … 続きを読む