cs.CV」カテゴリーアーカイブ

AI Guide Dog: Egocentric Path Prediction on Smartphone

要約 このペーパーでは、スマートフォンでのリアルタイムの展開用に設計された視覚障 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, cs.LG, cs.RO | AI Guide Dog: Egocentric Path Prediction on Smartphone はコメントを受け付けていません

SurgPose: a Dataset for Articulated Robotic Surgical Tool Pose Estimation and Tracking

要約 正確かつ効率的な外科的ロボットツールのポーズ推定は、外科的訓練や学習ベース … 続きを読む

カテゴリー: cs.CV, cs.RO | SurgPose: a Dataset for Articulated Robotic Surgical Tool Pose Estimation and Tracking はコメントを受け付けていません

High-quality Unknown Object Instance Segmentation via Quadruple Boundary Error Refinement

要約 構造化されていない環境での未知のオブジェクトの正確で効率的なセグメンテーシ … 続きを読む

カテゴリー: cs.CV, cs.RO | High-quality Unknown Object Instance Segmentation via Quadruple Boundary Error Refinement はコメントを受け付けていません

FUNCTO: Function-Centric One-Shot Imitation Learning for Tool Manipulation

要約 単一の人間のデモビデオからの学習ツールの使用は、ロボット教育に対する非常に … 続きを読む

カテゴリー: cs.CV, cs.RO | FUNCTO: Function-Centric One-Shot Imitation Learning for Tool Manipulation はコメントを受け付けていません

3D Gaussian Inpainting with Depth-Guided Cross-View Consistency

要約 ニューラル放射輝度フィールド(NERF)や3Dガウススプラッティング(3D … 続きを読む

カテゴリー: cs.CV, cs.LG | 3D Gaussian Inpainting with Depth-Guided Cross-View Consistency はコメントを受け付けていません

BitStack: Any-Size Compression of Large Language Models in Variable Memory Environments

要約 大規模な言語モデル(LLM)は多数のアプリケーションに革命をもたらしました … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | BitStack: Any-Size Compression of Large Language Models in Variable Memory Environments はコメントを受け付けていません

Revealing Bias Formation in Deep Neural Networks Through the Geometric Mechanisms of Human Visual Decoupling

要約 ディープニューラルネットワーク(DNNS)は、バランスの取れたトレーニング … 続きを読む

カテゴリー: cs.AI, cs.CV | Revealing Bias Formation in Deep Neural Networks Through the Geometric Mechanisms of Human Visual Decoupling はコメントを受け付けていません

Towards Scalable Insect Monitoring: Ultra-Lightweight CNNs as On-Device Triggers for Insect Camera Traps

要約 AIと組み合わせたカメラトラップは、自動化されたスケーラブルな生物多様性監 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, q-bio.QM | Towards Scalable Insect Monitoring: Ultra-Lightweight CNNs as On-Device Triggers for Insect Camera Traps はコメントを受け付けていません

Intuitive physics understanding emerges from self-supervised pretraining on natural videos

要約 私たちは、自然なビデオの仮面領域を予測するために訓練された一般的な深い神経 … 続きを読む

カテゴリー: cs.AI, cs.CV | Intuitive physics understanding emerges from self-supervised pretraining on natural videos はコメントを受け付けていません

ChordFormer: A Conformer-Based Architecture for Large-Vocabulary Audio Chord Recognition

要約 コード認識は、音楽分析におけるコードの抽象的で記述的な性質のため、音楽情報 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, cs.LG, cs.SD | ChordFormer: A Conformer-Based Architecture for Large-Vocabulary Audio Chord Recognition はコメントを受け付けていません