-
最近の投稿
- A Data-Driven Modeling and Motion Control of Heavy-Load Hydraulic Manipulators via Reversible Transformation
- Data-Driven Multi-step Nonlinear Model Predictive Control for Industrial Heavy Load Hydraulic Robot
- Image Compression Using Novel View Synthesis Priors
- OTO Planner: An Efficient Only Travelling Once Exploration Planner for Complex and Unknown Environments
- t-READi: Transformer-Powered Robust and Efficient Multimodal Inference for Autonomous Driving
-
最近のコメント
表示できるコメントはありません。 cs.AI (29990) cs.CL (22653) cs.CR (2325) cs.CV (36362) cs.LG (34812) cs.RO (17416) cs.SY (2673) eess.IV (4425) eess.SY (2667) stat.ML (4642)
月別アーカイブ: 2024年6月
SpatialBot: Precise Spatial Understanding with Vision Language Models
要約 ビジョン言語モデル (VLM) は、2D 画像理解において目覚ましいパフォ … 続きを読む
カテゴリー: cs.CV
SpatialBot: Precise Spatial Understanding with Vision Language Models はコメントを受け付けていません
Enhanced Data Transfer Cooperating with Artificial Triplets for Scene Graph Generation
要約 この研究は、シーン グラフ生成 (SGG) のための有益なリレーショナル … 続きを読む
カテゴリー: cs.CV
Enhanced Data Transfer Cooperating with Artificial Triplets for Scene Graph Generation はコメントを受け付けていません
Efficient World Models with Context-Aware Tokenization
要約 深い強化学習 (RL) 手法をスケールアップするには、大きな課題が伴います … 続きを読む
VDebugger: Harnessing Execution Feedback for Debugging Visual Programs
要約 ビジュアル プログラムは、視覚的な推論の問題に対処するために大規模な言語モ … 続きを読む
LiverUSRecon: Automatic 3D Reconstruction and Volumetry of the Liver with a Few Partial Ultrasound Scans
要約 体積測定のための肝臓の 3D 再構成は、定性分析と疾患診断にとって重要です … 続きを読む
Learning Visual Conditioning Tokens to Correct Domain Shift for Fully Test-time Adaptation
要約 完全なテスト時適応は、ディープ ニューラル ネットワークのクロスドメインの … 続きを読む
カテゴリー: cs.CV
Learning Visual Conditioning Tokens to Correct Domain Shift for Fully Test-time Adaptation はコメントを受け付けていません
Physics-Guided Neural Networks for Intraventricular Vector Flow Mapping
要約 心室内ベクトル フロー マッピング (iVFM) は、心臓イメージングにお … 続きを読む
CORE4D: A 4D Human-Object-Human Interaction Dataset for Collaborative Object REarrangement
要約 VR/AR および人間とロボットのインタラクションにとって、人間がどのよう … 続きを読む
カテゴリー: cs.CV
CORE4D: A 4D Human-Object-Human Interaction Dataset for Collaborative Object REarrangement はコメントを受け付けていません
Towards Semantic Equivalence of Tokenization in Multimodal LLM
要約 マルチモーダル大規模言語モデル (MLLM) は、視覚言語タスクの処理にお … 続きを読む
カテゴリー: cs.CV
Towards Semantic Equivalence of Tokenization in Multimodal LLM はコメントを受け付けていません
STAL3D: Unsupervised Domain Adaptation for 3D Object Detection via Collaborating Self-Training and Adversarial Learning
要約 既存の 3D オブジェクト検出は、高価なアノテーション コストと、ドメイン … 続きを読む
カテゴリー: cs.CV
STAL3D: Unsupervised Domain Adaptation for 3D Object Detection via Collaborating Self-Training and Adversarial Learning はコメントを受け付けていません