-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Learning Generative Interactive Environments By Trained Agent Exploration
要約 世界モデルは、複雑な環境のルールとアクションを解釈し、シミュレーションする … 続きを読む
PoseScript: Linking 3D Human Poses and Natural Language
要約 自然言語は、画像キャプション、視覚的な質問応答、クロスモーダル検索など、多 … 続きを読む
カテゴリー: cs.CV
PoseScript: Linking 3D Human Poses and Natural Language はコメントを受け付けていません
VITA: Towards Open-Source Interactive Omni Multimodal LLM
要約 GPT-4o の優れたマルチモーダル機能とインタラクティブなエクスペリエン … 続きを読む
EMCNet : Graph-Nets for Electron Micrographs Classification
要約 電子顕微鏡写真による材料の特性評価は、いくつかの材料加工産業において重要か … 続きを読む
LiDAR-based 4D Occupancy Completion and Forecasting
要約 シーンの完了と予測は、自動運転車などのモバイル エージェントの研究において … 続きを読む
Image Similarity using An Ensemble of Context-Sensitive Models
要約 画像の類似性は、コンピューター ビジョンにおいて広く研究されてきました。 … 続きを読む
カテゴリー: cs.CV
Image Similarity using An Ensemble of Context-Sensitive Models はコメントを受け付けていません
Neural Laplacian Operator for 3D Point Clouds
要約 離散ラプラシアン演算子は 3D ジオメトリ処理において重要な役割を果たして … 続きを読む
Valeo4Cast: A Modular Approach to End-to-End Forecasting
要約 動き予測は、歩行者、車両、信号機などの周囲のエージェントの将来の軌道を予測 … 続きを読む
Aligning Machine and Human Visual Representations across Abstraction Levels
要約 ディープ ニューラル ネットワークは、視覚タスクにおける人間の行動のモデル … 続きを読む
TiCoSS: Tightening the Coupling between Semantic Segmentation and Stereo Matching within A Joint Learning Framework
要約 セマンティック セグメンテーションとステレオ マッチングは、それぞれ人間の … 続きを読む