-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年7月
R3D-AD: Reconstruction via Diffusion for 3D Anomaly Detection
要約 3D 異常検出は、精密製造において局所的な固有欠陥がないか部品を監視する上 … 続きを読む
カテゴリー: cs.CV
R3D-AD: Reconstruction via Diffusion for 3D Anomaly Detection はコメントを受け付けていません
Deep Learning on Object-centric 3D Neural Fields
要約 近年、ニューラル フィールド (NF) は、画像、ビデオ、オーディオ、3D … 続きを読む
カテゴリー: cs.CV
Deep Learning on Object-centric 3D Neural Fields はコメントを受け付けていません
GPT Sonograpy: Hand Gesture Decoding from Forearm Ultrasound Images via VLM
要約 Generative Pre-trained Transformer 4- … 続きを読む
Random Channel Ablation for Robust Hand Gesture Classification with Multimodal Biosignals
要約 生体信号に基づくハンドジェスチャーの分類は、人間とマシンの効果的なインタラ … 続きを読む
RepVF: A Unified Vector Fields Representation for Multi-task 3D Perception
要約 同じ時空間シーン内で複数の自動運転 3D 認識タスクを同時に処理することは … 続きを読む
カテゴリー: cs.CV
RepVF: A Unified Vector Fields Representation for Multi-task 3D Perception はコメントを受け付けていません
DiagrammerGPT: Generating Open-Domain, Open-Platform Diagrams via LLM Planning
要約 Text-to-Image (T2I) の生成は、過去数年間で大幅に増加し … 続きを読む
Leveraging Multimodal CycleGAN for the Generation of Anatomically Accurate Synthetic CT Scans from MRIs
要約 多くの臨床現場では、患者の解剖学的構造を徹底的に理解し、適切な治療戦略を計 … 続きを読む
AutoEval-Video: An Automatic Benchmark for Assessing Large Vision Language Models in Open-Ended Video Question Answering
要約 私たちは、自由形式のビデオ質問応答で大規模なビジョン言語モデルを包括的に評 … 続きを読む
カテゴリー: cs.CV
AutoEval-Video: An Automatic Benchmark for Assessing Large Vision Language Models in Open-Ended Video Question Answering はコメントを受け付けていません
Interpreting Hand gestures using Object Detection and Digits Classification
要約 手のジェスチャーは、テクノロジーを利用するための自然かつ直感的な手段へと進 … 続きを読む
カテゴリー: cs.CV
Interpreting Hand gestures using Object Detection and Digits Classification はコメントを受け付けていません
SHINE: Saliency-aware HIerarchical NEgative Ranking for Compositional Temporal Grounding
要約 ビデオモーメント検索としても知られる時間的グラウンディングは、特定のクエリ … 続きを読む
カテゴリー: cs.CV
SHINE: Saliency-aware HIerarchical NEgative Ranking for Compositional Temporal Grounding はコメントを受け付けていません