cs.AI」カテゴリーアーカイブ

Metamorphic Testing for Pose Estimation Systems

要約 ポーズ推定システムは、スポーツ分析から家畜ケアまで、さまざまな分野で使用さ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.SE | Metamorphic Testing for Pose Estimation Systems はコメントを受け付けていません

Wholly-WOOD: Wholly Leveraging Diversified-quality Labels for Weakly-supervised Oriented Object Detection

要約 コンパクトな回転境界ボックス(Rbox)を使用した視覚オブジェクトの方向を … 続きを読む

カテゴリー: cs.AI, cs.CV | Wholly-WOOD: Wholly Leveraging Diversified-quality Labels for Weakly-supervised Oriented Object Detection はコメントを受け付けていません

EmbodiedBench: Comprehensive Benchmarking Multi-modal Large Language Models for Vision-Driven Embodied Agents

要約 具体化されたエージェントを作成するためにマルチモーダルの大手言語モデル(M … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | EmbodiedBench: Comprehensive Benchmarking Multi-modal Large Language Models for Vision-Driven Embodied Agents はコメントを受け付けていません

Heuristical Comparison of Vision Transformers Against Convolutional Neural Networks for Semantic Segmentation on Remote Sensing Imagery

要約 Vision Transformers(VIT)は最近、コンピュータービジ … 続きを読む

カテゴリー: cs.AI, cs.CV | Heuristical Comparison of Vision Transformers Against Convolutional Neural Networks for Semantic Segmentation on Remote Sensing Imagery はコメントを受け付けていません

Opening Articulated Objects in the Real World

要約 以前に見えなかった環境で、以前に見えなかったオブジェクトで有能に動作できる … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Opening Articulated Objects in the Real World はコメントを受け付けていません

DexTrack: Towards Generalizable Neural Tracking Control for Dexterous Manipulation from Human References

要約 人間の参照からの器用な操作のための一般化可能なニューラル追跡コントローラー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | DexTrack: Towards Generalizable Neural Tracking Control for Dexterous Manipulation from Human References はコメントを受け付けていません

Exploring the Potential of Encoder-free Architectures in 3D LMMs

要約 エンコーダーフリーのアーキテクチャは、2Dビジュアルドメインで事前に検討さ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Exploring the Potential of Encoder-free Architectures in 3D LMMs はコメントを受け付けていません

MME-CoT: Benchmarking Chain-of-Thought in Large Multimodal Models for Reasoning Quality, Robustness, and Efficiency

要約 チェーンオブシュート(COT)で質問に答えることで、大規模な言語モデル(L … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | MME-CoT: Benchmarking Chain-of-Thought in Large Multimodal Models for Reasoning Quality, Robustness, and Efficiency はコメントを受け付けていません

Better Embeddings with Coupled Adam

要約 それらの驚くべき能力にもかかわらず、LLMSは、異方性の望ましくないが理解 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Better Embeddings with Coupled Adam はコメントを受け付けていません

Surface Vision Mamba: Leveraging Bidirectional State Space Model for Efficient Spherical Manifold Representation

要約 注意ベースの方法は、従来の幾何学的深部学習(GDL)モデルを上回り、球状の … 続きを読む

カテゴリー: cs.AI, cs.CV | Surface Vision Mamba: Leveraging Bidirectional State Space Model for Efficient Spherical Manifold Representation はコメントを受け付けていません