cs.CV」カテゴリーアーカイブ

Dream to Manipulate: Compositional World Models Empowering Robot Imitation Learning with Imagination

要約 世界モデルは、エージェントにその環境の表現を提供し、その行動の因果的な結果 … 続きを読む

カテゴリー: cs.CV, cs.RO | Dream to Manipulate: Compositional World Models Empowering Robot Imitation Learning with Imagination はコメントを受け付けていません

VidBot: Learning Generalizable 3D Actions from In-the-Wild 2D Human Videos for Zero-Shot Robotic Manipulation

要約 将来のロボットは、さまざまな家庭用タスクを実行できる多目的システムとして想 … 続きを読む

カテゴリー: cs.CV, cs.RO | VidBot: Learning Generalizable 3D Actions from In-the-Wild 2D Human Videos for Zero-Shot Robotic Manipulation はコメントを受け付けていません

Temporal Overlapping Prediction: A Self-supervised Pre-training Method for LiDAR Moving Object Segmentation

要約 Lidar Point Cloudsの移動オブジェクトセグメンテーション( … 続きを読む

カテゴリー: cs.CV, cs.RO | Temporal Overlapping Prediction: A Self-supervised Pre-training Method for LiDAR Moving Object Segmentation はコメントを受け付けていません

Interpretable deformable image registration: A geometric deep learning perspective

要約 変形可能な画像登録は、ほとんどの深い学習タスクとは異なり、複数の座標系の複 … 続きを読む

カテゴリー: cs.CV, cs.LG | Interpretable deformable image registration: A geometric deep learning perspective はコメントを受け付けていません

Efficient Distillation of Classifier-Free Guidance using Adapters

要約 条件付き拡散モデルには、分類器のないガイダンス(CFG)が不可欠ですが、推 … 続きを読む

カテゴリー: cs.CV, cs.LG | Efficient Distillation of Classifier-Free Guidance using Adapters はコメントを受け付けていません

A Systematic Review of ECG Arrhythmia Classification: Adherence to Standards, Fair Evaluation, and Embedded Feasibility

要約 心電図(ECG)シグナルの分類は、不整脈やその他の心臓条件の早期発見に不可 … 続きを読む

カテゴリー: cs.CV, cs.LG | A Systematic Review of ECG Arrhythmia Classification: Adherence to Standards, Fair Evaluation, and Embedded Feasibility はコメントを受け付けていません

Multimodal Human-AI Synergy for Medical Imaging Quality Control: A Hybrid Intelligence Framework with Adaptive Dataset Curation and Closed-Loop Evaluation

要約 医療イメージング品質管理(QC)は正確な診断に不可欠ですが、従来のQC方法 … 続きを読む

カテゴリー: cs.CL, cs.CV | Multimodal Human-AI Synergy for Medical Imaging Quality Control: A Hybrid Intelligence Framework with Adaptive Dataset Curation and Closed-Loop Evaluation はコメントを受け付けていません

Multi-Modal 3D Mesh Reconstruction from Images and Text

要約 目に見えないオブジェクトの6Dオブジェクトのポーズ推定は、ロボット工学では … 続きを読む

カテゴリー: cs.CL, cs.CV | Multi-Modal 3D Mesh Reconstruction from Images and Text はコメントを受け付けていません

SIDA: Social Media Image Deepfake Detection, Localization and Explanation with Large Multimodal Model

要約 非常に現実的な画像の作成における生成モデルの急速な進歩は、誤った情報の普及 … 続きを読む

カテゴリー: cs.AI, cs.CV | SIDA: Social Media Image Deepfake Detection, Localization and Explanation with Large Multimodal Model はコメントを受け付けていません

CAD-Assistant: Tool-Augmented VLLMs as Generic CAD Task Solvers

要約 AIアシストデザインの汎用CADエージェントであるCADアシスタントを提案 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | CAD-Assistant: Tool-Augmented VLLMs as Generic CAD Task Solvers はコメントを受け付けていません