-
最近の投稿
- Simplified POMDP Planning with an Alternative Observation Space and Formal Performance Guarantees
- FREA: Feasibility-Guided Generation of Safety-Critical Scenarios with Reasonable Adversariality
- Enhanced Robot Planning and Perception through Environment Prediction
- FlowRetrieval: Flow-Guided Data Retrieval for Few-Shot Imitation Learning
- Energy-Cautious Designation of Kinematic Parameters for a Sustainable Parallel-Serial Heavy-Duty Manipulator Driven by Electromechanical Linear Actuator
-
最近のコメント
表示できるコメントはありません。 cs.AI (27989) cs.CL (21147) cs.CR (2187) cs.CV (34671) cs.LG (32719) cs.RO (16074) cs.SY (2489) eess.IV (4240) eess.SY (2483) stat.ML (4382)
「cs.CV」カテゴリーアーカイブ
Test-Time Certifiable Self-Supervision to Bridge the Sim2Real Gap in Event-Based Satellite Pose Estimation
要約 ディープラーニングは、ビジョンベースの衛星姿勢推定において重要な役割を果た … 続きを読む
Multimodal Active Measurement for Human Mesh Recovery in Close Proximity
要約 物理的な人間とロボットの相互作用 (pHRI) の場合、ロボットは対象者の … 続きを読む
Shedding More Light on Robust Classifiers under the lens of Energy-based Models
要約 堅牢な識別分類子をエネルギーベース モデル (EBM) として再解釈するこ … 続きを読む
SpikeCLIP: A Contrastive Language-Image Pretrained Spiking Neural Network
要約 スパイキング ニューラル ネットワーク (SNN) は、従来の人工ニューラ … 続きを読む
MMMU-Pro: A More Robust Multi-discipline Multimodal Understanding Benchmark
要約 このペーパーでは、Massive Multi-discipline Mul … 続きを読む
Distilling Generative-Discriminative Representations for Very Low-Resolution Face Recognition
要約 非常に低解像度の顔認識は、解像度の低下により情報となる顔の詳細が大幅に失わ … 続きを読む
Learning Generative Interactive Environments By Trained Agent Exploration
要約 世界モデルは、複雑な環境のルールとアクションを解釈し、シミュレーションする … 続きを読む
PoseScript: Linking 3D Human Poses and Natural Language
要約 自然言語は、画像キャプション、視覚的な質問応答、クロスモーダル検索など、多 … 続きを読む
カテゴリー: cs.CV
PoseScript: Linking 3D Human Poses and Natural Language はコメントを受け付けていません
VITA: Towards Open-Source Interactive Omni Multimodal LLM
要約 GPT-4o の優れたマルチモーダル機能とインタラクティブなエクスペリエン … 続きを読む
EMCNet : Graph-Nets for Electron Micrographs Classification
要約 電子顕微鏡写真による材料の特性評価は、いくつかの材料加工産業において重要か … 続きを読む