cs.CV」カテゴリーアーカイブ

Neuromorphic spatiotemporal optical flow: Enabling ultrafast visual perception beyond human capabilities

要約 生物学的視覚システムのメカニズムに触発された光学フローは、ロボット工学が複 … 続きを読む

カテゴリー: cs.CV, cs.RO | Neuromorphic spatiotemporal optical flow: Enabling ultrafast visual perception beyond human capabilities はコメントを受け付けていません

LMFusion: Adapting Pretrained Language Models for Multimodal Generation

要約 LMFusionを、マルチモーダル生成機能を備えた事前に守られたテキストの … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | LMFusion: Adapting Pretrained Language Models for Multimodal Generation はコメントを受け付けていません

Surface Defect Identification using Bayesian Filtering on a 3D Mesh

要約 このペーパーでは、自動化された表面欠陥検出のためのCADベースのアプローチ … 続きを読む

カテゴリー: cs.CV, cs.RO | Surface Defect Identification using Bayesian Filtering on a 3D Mesh はコメントを受け付けていません

A Video-grounded Dialogue Dataset and Metric for Event-driven Activities

要約 このペーパーでは、タスク用に特別に設計されたセッションベースのコンテキスト … 続きを読む

カテゴリー: cs.CL, cs.CV | A Video-grounded Dialogue Dataset and Metric for Event-driven Activities はコメントを受け付けていません

CodeBrain: Impute Any Brain MRI via Instance-specific Scalar-quantized Codes

要約 MRI代入は、1つ以上の利用可能なモダリティから欠落しているモダリティを合 … 続きを読む

カテゴリー: cs.AI, cs.CV | CodeBrain: Impute Any Brain MRI via Instance-specific Scalar-quantized Codes はコメントを受け付けていません

The Batch Artifact Scanning Protocol: A new method using computed tomography (CT) to rapidly create three-dimensional models of objects from large collections en masse

要約 人類学では、3次元(3D)イメージングの使用は、広範囲の主要な人類学的問題 … 続きを読む

カテゴリー: 68U05, 68W99, cs.CV, J.0 | The Batch Artifact Scanning Protocol: A new method using computed tomography (CT) to rapidly create three-dimensional models of objects from large collections en masse はコメントを受け付けていません

Video-based Surgical Tool-tip and Keypoint Tracking using Multi-frame Context-driven Deep Learning Models

要約 ロボット手術ビデオにおける手術ツールキーポイントの自動追跡は、スキル評価、 … 続きを読む

カテゴリー: cs.CV | Video-based Surgical Tool-tip and Keypoint Tracking using Multi-frame Context-driven Deep Learning Models はコメントを受け付けていません

MedXpertQA: Benchmarking Expert-Level Medical Reasoning and Understanding

要約 専門家レベルの医療知識と高度な推論を評価するために、非常に挑戦的で包括的な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | MedXpertQA: Benchmarking Expert-Level Medical Reasoning and Understanding はコメントを受け付けていません

Cracks in concrete

要約 コンクリートの画像の亀裂を見つけて適切にセグメント化することは、困難な作業 … 続きを読む

カテゴリー: 60D05, cs.CV, eess.IV, stat.AP | Cracks in concrete はコメントを受け付けていません

Dual Thinking and Logical Processing — Are Multi-modal Large Language Models Closing the Gap with Human Vision ?

要約 デュアル思考フレームワークでは、高速で直感的な処理と遅い論理処理を考慮しま … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Dual Thinking and Logical Processing — Are Multi-modal Large Language Models Closing the Gap with Human Vision ? はコメントを受け付けていません