cs.CV」カテゴリーアーカイブ

Test-Time Certifiable Self-Supervision to Bridge the Sim2Real Gap in Event-Based Satellite Pose Estimation

要約 ディープラーニングは、ビジョンベースの衛星姿勢推定において重要な役割を果た … 続きを読む

カテゴリー: cs.CV, cs.RO | Test-Time Certifiable Self-Supervision to Bridge the Sim2Real Gap in Event-Based Satellite Pose Estimation はコメントを受け付けていません

Multimodal Active Measurement for Human Mesh Recovery in Close Proximity

要約 物理的な人間とロボットの相互作用 (pHRI) の場合、ロボットは対象者の … 続きを読む

カテゴリー: cs.CV, cs.RO | Multimodal Active Measurement for Human Mesh Recovery in Close Proximity はコメントを受け付けていません

Shedding More Light on Robust Classifiers under the lens of Energy-based Models

要約 堅牢な識別分類子をエネルギーベース モデル (EBM) として再解釈するこ … 続きを読む

カテゴリー: cs.CV, cs.LG | Shedding More Light on Robust Classifiers under the lens of Energy-based Models はコメントを受け付けていません

SpikeCLIP: A Contrastive Language-Image Pretrained Spiking Neural Network

要約 スパイキング ニューラル ネットワーク (SNN) は、従来の人工ニューラ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.NE | SpikeCLIP: A Contrastive Language-Image Pretrained Spiking Neural Network はコメントを受け付けていません

MMMU-Pro: A More Robust Multi-discipline Multimodal Understanding Benchmark

要約 このペーパーでは、Massive Multi-discipline Mul … 続きを読む

カテゴリー: cs.CL, cs.CV | MMMU-Pro: A More Robust Multi-discipline Multimodal Understanding Benchmark はコメントを受け付けていません

Distilling Generative-Discriminative Representations for Very Low-Resolution Face Recognition

要約 非常に低解像度の顔認識は、解像度の低下により情報となる顔の詳細が大幅に失わ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Distilling Generative-Discriminative Representations for Very Low-Resolution Face Recognition はコメントを受け付けていません

Learning Generative Interactive Environments By Trained Agent Exploration

要約 世界モデルは、複雑な環境のルールとアクションを解釈し、シミュレーションする … 続きを読む

カテゴリー: cs.AI, cs.CV | Learning Generative Interactive Environments By Trained Agent Exploration はコメントを受け付けていません

PoseScript: Linking 3D Human Poses and Natural Language

要約 自然言語は、画像キャプション、視覚的な質問応答、クロスモーダル検索など、多 … 続きを読む

カテゴリー: cs.CV | PoseScript: Linking 3D Human Poses and Natural Language はコメントを受け付けていません

VITA: Towards Open-Source Interactive Omni Multimodal LLM

要約 GPT-4o の優れたマルチモーダル機能とインタラクティブなエクスペリエン … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | VITA: Towards Open-Source Interactive Omni Multimodal LLM はコメントを受け付けていません

EMCNet : Graph-Nets for Electron Micrographs Classification

要約 電子顕微鏡写真による材料の特性評価は、いくつかの材料加工産業において重要か … 続きを読む

カテゴリー: cs.CV, cs.LG | EMCNet : Graph-Nets for Electron Micrographs Classification はコメントを受け付けていません