月別アーカイブ: 2024年2月

PBADet: A One-Stage Anchor-Free Approach for Part-Body Association

要約 人間の部分 (手、顔など) を検出し、それらを個人と正しく関連付けることは … 続きを読む

カテゴリー: cs.AI, cs.CV | PBADet: A One-Stage Anchor-Free Approach for Part-Body Association はコメントを受け付けていません

A Benchmark Grocery Dataset of Realworld Point Clouds From Single View

要約 きめ細かい食料品物体認識は、自動チェックアウト、店内ロボットナビゲーション … 続きを読む

カテゴリー: cs.CV | A Benchmark Grocery Dataset of Realworld Point Clouds From Single View はコメントを受け付けていません

Towards Meta-Pruning via Optimal Transport

要約 従来、ニューラル ネットワークの構造枝刈りは、重要度の低いニューロンを特定 … 続きを読む

カテゴリー: cs.CV, cs.LG | Towards Meta-Pruning via Optimal Transport はコメントを受け付けていません

Prismatic VLMs: Investigating the Design Space of Visually-Conditioned Language Models

要約 視覚条件付き言語モデル (VLM) は、視覚的な対話、シーンの理解、ロボッ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Prismatic VLMs: Investigating the Design Space of Visually-Conditioned Language Models はコメントを受け付けていません

PIVOT: Iterative Visual Prompting Elicits Actionable Knowledge for VLMs

要約 ビジョン言語モデル (VLM) は、論理的推論から視覚的な理解まで、さまざ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.RO | PIVOT: Iterative Visual Prompting Elicits Actionable Knowledge for VLMs はコメントを受け付けていません

MODIPHY: Multimodal Obscured Detection for IoT using PHantom Convolution-Enabled Faster YOLO

要約 低照度条件や遮蔽されたシナリオは、自動運転車やセキュリティ システムなどの … 続きを読む

カテゴリー: cs.CV | MODIPHY: Multimodal Obscured Detection for IoT using PHantom Convolution-Enabled Faster YOLO はコメントを受け付けていません

Detection of Spider Mites on Labrador Beans through Machine Learning Approaches Using Custom Datasets

要約 食糧生産の需要が高まる中、作物を守るためには植物の病気を早期に検出すること … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Detection of Spider Mites on Labrador Beans through Machine Learning Approaches Using Custom Datasets はコメントを受け付けていません

Wavefront Randomization Improves Deconvolution

要約 イメージング システムのパフォーマンスは光学収差によって制限され、結果とし … 続きを読む

カテゴリー: cs.CV, eess.IV, I.4.4, physics.optics | Wavefront Randomization Improves Deconvolution はコメントを受け付けていません

Premier-TACO is a Few-Shot Policy Learner: Pretraining Multitask Representation via Temporal Action-Driven Contrastive Loss

要約 我々は、連続的な意思決定タスクにおける少数ショットのポリシー学習効率を向上 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Premier-TACO is a Few-Shot Policy Learner: Pretraining Multitask Representation via Temporal Action-Driven Contrastive Loss はコメントを受け付けていません

Safe Reinforcement Learning as Wasserstein Variational Inference: Formal Methods for Interpretability

要約 強化学習は、可変ダイナミクスを伴う連続的な意思決定の問題に対して効果的な推 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO, cs.SY, eess.SY | Safe Reinforcement Learning as Wasserstein Variational Inference: Formal Methods for Interpretability はコメントを受け付けていません