cs.AI」カテゴリーアーカイブ

Seeing is Understanding: Unlocking Causal Attention into Modality-Mutual Attention for Multimodal LLMs

要約 最近のマルチモーダル大手言語モデル(MLLMS)は、マルチモーダルの問い合 … 続きを読む

カテゴリー: cs.AI, cs.CV | Seeing is Understanding: Unlocking Causal Attention into Modality-Mutual Attention for Multimodal LLMs はコメントを受け付けていません

WalnutData: A UAV Remote Sensing Dataset of Green Walnuts and Model Evaluation

要約 UAVテクノロジーは徐々に成熟しており、スマートな農業と正確な監視に対する … 続きを読む

カテゴリー: cs.AI, cs.CV | WalnutData: A UAV Remote Sensing Dataset of Green Walnuts and Model Evaluation はコメントを受け付けていません

R2Det: Exploring Relaxed Rotation Equivariance in 2D object detection

要約 Group Equivariant Convolution(GCONV)は … 続きを読む

カテゴリー: cs.AI, cs.CV | R2Det: Exploring Relaxed Rotation Equivariance in 2D object detection はコメントを受け付けていません

A dataset-free approach for self-supervised learning of 3D reflectional symmetries

要約 このホワイトペーパーでは、入力オブジェクト自体のみでデータセットに依存する … 続きを読む

カテゴリー: cs.AI, cs.CV | A dataset-free approach for self-supervised learning of 3D reflectional symmetries はコメントを受け付けていません

State of play and future directions in industrial computer vision AI standards

要約 人工知能(AI)とディープラーニング(DL)の分野における最近の途方もない … 続きを読む

カテゴリー: cs.AI, cs.CV | State of play and future directions in industrial computer vision AI standards はコメントを受け付けていません

Class-Aware PillarMix: Can Mixed Sample Data Augmentation Enhance 3D Object Detection with Radar Point Clouds?

要約 3D認識タスクでのデータ収集と注釈に必要な努力により、既存のデータを混合す … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Class-Aware PillarMix: Can Mixed Sample Data Augmentation Enhance 3D Object Detection with Radar Point Clouds? はコメントを受け付けていません

Memory Efficient Continual Learning for Edge-Based Visual Anomaly Detection

要約 視覚異常検出(VAD)は、多数の現実世界のアプリケーションを備えたコンピュ … 続きを読む

カテゴリー: cs.AI, cs.CV | Memory Efficient Continual Learning for Edge-Based Visual Anomaly Detection はコメントを受け付けていません

WalkVLM:Aid Visually Impaired People Walking by Vision Language Model

要約 世界中の約2億人の個人が視覚障害の程度がさまざまであるため、AIテクノロジ … 続きを読む

カテゴリー: cs.AI, cs.CV | WalkVLM:Aid Visually Impaired People Walking by Vision Language Model はコメントを受け付けていません

A Comprehensive Survey on Composed Image Retrieval

要約 Composed Image Retrieval(CIR)は、ユーザーが参 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, cs.MM | A Comprehensive Survey on Composed Image Retrieval はコメントを受け付けていません

UAR-NVC: A Unified AutoRegressive Framework for Memory-Efficient Neural Video Compression

要約 暗黙の神経表現(INR)は、ビデオをニューラルネットワークとして表現するこ … 続きを読む

カテゴリー: cs.AI, cs.CV | UAR-NVC: A Unified AutoRegressive Framework for Memory-Efficient Neural Video Compression はコメントを受け付けていません