-
最近の投稿
- Multimodal Active Measurement for Human Mesh Recovery in Close Proximity
- An Algorithm for Distributed Computation of Reachable Sets for Multi-Agent Systems
- Meta-Learning Augmented MPC for Disturbance-Aware Motion Planning and Control of Quadrotors
- Solving Multi-Goal Robotic Tasks with Decision Transformer
- Context-Aware Command Understanding for Tabletop Scenarios
-
最近のコメント
表示できるコメントはありません。 cs.AI (27848) cs.CL (21045) cs.CR (2180) cs.CV (34554) cs.LG (32592) cs.RO (15968) cs.SY (2478) eess.IV (4238) eess.SY (2472) stat.ML (4364)
月別アーカイブ: 2024年6月
MonoBox: Tightness-free Box-supervised Polyp Segmentation using Monotonicity Constraint
要約 私たちは、単調性によって制約された革新的なボックス教師ありセグメンテーショ … 続きを読む
カテゴリー: cs.CV
MonoBox: Tightness-free Box-supervised Polyp Segmentation using Monotonicity Constraint はコメントを受け付けていません
The Championship-Winning Solution for the 5th CLVISION Challenge 2024
要約 このホワイトペーパーでは、従来のクラスの段階的学習を超えた独特の課題を提示 … 続きを読む
カテゴリー: cs.CV
The Championship-Winning Solution for the 5th CLVISION Challenge 2024 はコメントを受け付けていません
NeST: Neural Stress Tensor Tomography by leveraging 3D Photoelasticity
要約 光弾性により、応力誘起複屈折を通じて透明物体の全視野応力解析が可能になりま … 続きを読む
OmAgent: A Multi-modal Agent Framework for Complex Video Understanding with Task Divide-and-Conquer
要約 大規模言語モデル (LLM) の最近の進歩により、その機能は包括的なビデオ … 続きを読む
カテゴリー: cs.CV
OmAgent: A Multi-modal Agent Framework for Complex Video Understanding with Task Divide-and-Conquer はコメントを受け付けていません
Articulate your NeRF: Unsupervised articulated object modeling via conditional view synthesis
要約 我々は、剛体パーツを備えた多関節オブジェクトの姿勢とパーツセグメンテーショ … 続きを読む
カテゴリー: cs.CV
Articulate your NeRF: Unsupervised articulated object modeling via conditional view synthesis はコメントを受け付けていません
MLAAN: Scaling Supervised Local Learning with Multilaminar Leap Augmented Auxiliary Network
要約 エンドツーエンド (E2E) トレーニング アプローチは一般に、メモリ消費 … 続きを読む
カテゴリー: cs.CV
MLAAN: Scaling Supervised Local Learning with Multilaminar Leap Augmented Auxiliary Network はコメントを受け付けていません
Feature Fusion for Human Activity Recognition using Parameter-Optimized Multi-Stage Graph Convolutional Network and Transformer Models
要約 人間活動認識 (HAR) は、コンピューターとマシン ビジョン テクノロジ … 続きを読む
Vision-Language Consistency Guided Multi-modal Prompt Learning for Blind AI Generated Image Quality Assessment
要約 最近、テキスト プロンプト チューニングは、Contrastive Lan … 続きを読む
Sampling Strategies in Bayesian Inversion: A Study of RTO and Langevin Methods
要約 この論文では、逆問題を解くための 2 つのクラスのサンプリング手法、つまり … 続きを読む
Repulsive Score Distillation for Diverse Sampling of Diffusion Models
要約 スコア蒸留サンプリングは、拡散モデルを複雑なビジュアルの生成に統合するため … 続きを読む