月別アーカイブ: 2024年7月

R3D-AD: Reconstruction via Diffusion for 3D Anomaly Detection

投稿日: 2024年7月16日作成者: jarxiv

要約 3D 異常検出は、精密製造において局所的な固有欠陥がないか部品を監視する上 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Deep Learning on Object-centric 3D Neural Fields

投稿日: 2024年7月16日作成者: jarxiv

要約近年、ニューラルフィールド (NF) は、画像、ビデオ、オーディオ、3D … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

GPT Sonograpy: Hand Gesture Decoding from Forearm Ultrasound Images via VLM

投稿日: 2024年7月16日作成者: jarxiv

要約 Generative Pre-trained Transformer 4- … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.HC, cs.LG | コメントを受け付けていません

Random Channel Ablation for Robust Hand Gesture Classification with Multimodal Biosignals

投稿日: 2024年7月16日作成者: jarxiv

要約生体信号に基づくハンドジェスチャーの分類は、人間とマシンの効果的なインタラ … 続きを読む →

カテゴリー: cs.CV, cs.HC, cs.LG | コメントを受け付けていません

RepVF: A Unified Vector Fields Representation for Multi-task 3D Perception

投稿日: 2024年7月16日作成者: jarxiv

要約同じ時空間シーン内で複数の自動運転 3D 認識タスクを同時に処理することは … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DiagrammerGPT: Generating Open-Domain, Open-Platform Diagrams via LLM Planning

投稿日: 2024年7月16日作成者: jarxiv

要約 Text-to-Image (T2I) の生成は、過去数年間で大幅に増加し … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Leveraging Multimodal CycleGAN for the Generation of Anatomically Accurate Synthetic CT Scans from MRIs

投稿日: 2024年7月16日作成者: jarxiv

要約多くの臨床現場では、患者の解剖学的構造を徹底的に理解し、適切な治療戦略を計 … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

AutoEval-Video: An Automatic Benchmark for Assessing Large Vision Language Models in Open-Ended Video Question Answering

投稿日: 2024年7月16日作成者: jarxiv

要約私たちは、自由形式のビデオ質問応答で大規模なビジョン言語モデルを包括的に評 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Interpreting Hand gestures using Object Detection and Digits Classification

投稿日: 2024年7月16日作成者: jarxiv

要約手のジェスチャーは、テクノロジーを利用するための自然かつ直感的な手段へと進 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

SHINE: Saliency-aware HIerarchical NEgative Ranking for Compositional Temporal Grounding

投稿日: 2024年7月16日作成者: jarxiv

要約ビデオモーメント検索としても知られる時間的グラウンディングは、特定のクエリ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年7月

R3D-AD: Reconstruction via Diffusion for 3D Anomaly Detection

Deep Learning on Object-centric 3D Neural Fields

GPT Sonograpy: Hand Gesture Decoding from Forearm Ultrasound Images via VLM

Random Channel Ablation for Robust Hand Gesture Classification with Multimodal Biosignals

RepVF: A Unified Vector Fields Representation for Multi-task 3D Perception

DiagrammerGPT: Generating Open-Domain, Open-Platform Diagrams via LLM Planning

Leveraging Multimodal CycleGAN for the Generation of Anatomically Accurate Synthetic CT Scans from MRIs

AutoEval-Video: An Automatic Benchmark for Assessing Large Vision Language Models in Open-Ended Video Question Answering

Interpreting Hand gestures using Object Detection and Digits Classification

SHINE: Saliency-aware HIerarchical NEgative Ranking for Compositional Temporal Grounding

最近の投稿

最近のコメント

アーカイブ

カテゴリー