「cs.CV」カテゴリーアーカイブ

Learning Generative Interactive Environments By Trained Agent Exploration

投稿日: 2024年9月11日作成者: jarxiv

要約世界モデルは、複雑な環境のルールとアクションを解釈し、シミュレーションする … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

PoseScript: Linking 3D Human Poses and Natural Language

投稿日: 2024年9月11日作成者: jarxiv

要約自然言語は、画像キャプション、視覚的な質問応答、クロスモーダル検索など、多 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

VITA: Towards Open-Source Interactive Omni Multimodal LLM

投稿日: 2024年9月11日作成者: jarxiv

要約 GPT-4o の優れたマルチモーダル機能とインタラクティブなエクスペリエン … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

EMCNet : Graph-Nets for Electron Micrographs Classification

投稿日: 2024年9月11日作成者: jarxiv

要約電子顕微鏡写真による材料の特性評価は、いくつかの材料加工産業において重要か … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

LiDAR-based 4D Occupancy Completion and Forecasting

投稿日: 2024年9月11日作成者: jarxiv

要約シーンの完了と予測は、自動運転車などのモバイルエージェントの研究において … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Image Similarity using An Ensemble of Context-Sensitive Models

投稿日: 2024年9月11日作成者: jarxiv

要約画像の類似性は、コンピュータービジョンにおいて広く研究されてきました。 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Neural Laplacian Operator for 3D Point Clouds

投稿日: 2024年9月11日作成者: jarxiv

要約離散ラプラシアン演算子は 3D ジオメトリ処理において重要な役割を果たして … 続きを読む →

カテゴリー: cs.CV, cs.GR | コメントを受け付けていません

Valeo4Cast: A Modular Approach to End-to-End Forecasting

投稿日: 2024年9月11日作成者: jarxiv

要約動き予測は、歩行者、車両、信号機などの周囲のエージェントの将来の軌道を予測 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Aligning Machine and Human Visual Representations across Abstraction Levels

投稿日: 2024年9月11日作成者: jarxiv

要約ディープニューラルネットワークは、視覚タスクにおける人間の行動のモデル … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

TiCoSS: Tightening the Coupling between Semantic Segmentation and Stereo Matching within A Joint Learning Framework

投稿日: 2024年9月11日作成者: jarxiv

要約セマンティックセグメンテーションとステレオマッチングは、それぞれ人間の … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Learning Generative Interactive Environments By Trained Agent Exploration

PoseScript: Linking 3D Human Poses and Natural Language

VITA: Towards Open-Source Interactive Omni Multimodal LLM

EMCNet : Graph-Nets for Electron Micrographs Classification

LiDAR-based 4D Occupancy Completion and Forecasting

Image Similarity using An Ensemble of Context-Sensitive Models

Neural Laplacian Operator for 3D Point Clouds

Valeo4Cast: A Modular Approach to End-to-End Forecasting

Aligning Machine and Human Visual Representations across Abstraction Levels

TiCoSS: Tightening the Coupling between Semantic Segmentation and Stereo Matching within A Joint Learning Framework

最近の投稿

最近のコメント

アーカイブ

カテゴリー