月別アーカイブ: 2024年7月

R3D-AD: Reconstruction via Diffusion for 3D Anomaly Detection

要約 3D 異常検出は、精密製造において局所的な固有欠陥がないか部品を監視する上 … 続きを読む

カテゴリー: cs.CV | R3D-AD: Reconstruction via Diffusion for 3D Anomaly Detection はコメントを受け付けていません

Deep Learning on Object-centric 3D Neural Fields

要約 近年、ニューラル フィールド (NF) は、画像、ビデオ、オーディオ、3D … 続きを読む

カテゴリー: cs.CV | Deep Learning on Object-centric 3D Neural Fields はコメントを受け付けていません

GPT Sonograpy: Hand Gesture Decoding from Forearm Ultrasound Images via VLM

要約 Generative Pre-trained Transformer 4- … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, cs.LG | GPT Sonograpy: Hand Gesture Decoding from Forearm Ultrasound Images via VLM はコメントを受け付けていません

Random Channel Ablation for Robust Hand Gesture Classification with Multimodal Biosignals

要約 生体信号に基づくハンドジェスチャーの分類は、人間とマシンの効果的なインタラ … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.LG | Random Channel Ablation for Robust Hand Gesture Classification with Multimodal Biosignals はコメントを受け付けていません

RepVF: A Unified Vector Fields Representation for Multi-task 3D Perception

要約 同じ時空間シーン内で複数の自動運転 3D 認識タスクを同時に処理することは … 続きを読む

カテゴリー: cs.CV | RepVF: A Unified Vector Fields Representation for Multi-task 3D Perception はコメントを受け付けていません

DiagrammerGPT: Generating Open-Domain, Open-Platform Diagrams via LLM Planning

要約 Text-to-Image (T2I) の生成は、過去数年間で大幅に増加し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | DiagrammerGPT: Generating Open-Domain, Open-Platform Diagrams via LLM Planning はコメントを受け付けていません

Leveraging Multimodal CycleGAN for the Generation of Anatomically Accurate Synthetic CT Scans from MRIs

要約 多くの臨床現場では、患者の解剖学的構造を徹底的に理解し、適切な治療戦略を計 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Leveraging Multimodal CycleGAN for the Generation of Anatomically Accurate Synthetic CT Scans from MRIs はコメントを受け付けていません

AutoEval-Video: An Automatic Benchmark for Assessing Large Vision Language Models in Open-Ended Video Question Answering

要約 私たちは、自由形式のビデオ質問応答で大規模なビジョン言語モデルを包括的に評 … 続きを読む

カテゴリー: cs.CV | AutoEval-Video: An Automatic Benchmark for Assessing Large Vision Language Models in Open-Ended Video Question Answering はコメントを受け付けていません

Interpreting Hand gestures using Object Detection and Digits Classification

要約 手のジェスチャーは、テクノロジーを利用するための自然かつ直感的な手段へと進 … 続きを読む

カテゴリー: cs.CV | Interpreting Hand gestures using Object Detection and Digits Classification はコメントを受け付けていません

SHINE: Saliency-aware HIerarchical NEgative Ranking for Compositional Temporal Grounding

要約 ビデオモーメント検索としても知られる時間的グラウンディングは、特定のクエリ … 続きを読む

カテゴリー: cs.CV | SHINE: Saliency-aware HIerarchical NEgative Ranking for Compositional Temporal Grounding はコメントを受け付けていません