-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Adaptive Deviation Learning for Visual Anomaly Detection with Data Contamination
要約 視覚的異常検出は、正常なパターンと著しく異なる画像を検出することを目的とし … 続きを読む
Diffusion Sampling Correction via Approximately 10 Parameters
要約 拡散確率モデル (DPM) は生成タスクにおいて優れたパフォーマンスを示し … 続きを読む
VPBSD:Vessel-Pattern-Based Semi-Supervised Distillation for Efficient 3D Microscopic Cerebrovascular Segmentation
要約 3D 顕微鏡脳血管画像はその高解像度が特徴であり、注釈付けに大きな課題があ … 続きを読む
カテゴリー: cs.CV
VPBSD:Vessel-Pattern-Based Semi-Supervised Distillation for Efficient 3D Microscopic Cerebrovascular Segmentation はコメントを受け付けていません
Dynamic Reconstruction of Hand-Object Interaction with Distributed Force-aware Contact Representation
要約 我々は、より正確な接触モデリングのために分散触覚センシングを統合した、動的 … 続きを読む
カテゴリー: cs.CV
Dynamic Reconstruction of Hand-Object Interaction with Distributed Force-aware Contact Representation はコメントを受け付けていません
V2A-Mark: Versatile Deep Visual-Audio Watermarking for Manipulation Localization and Copyright Protection
要約 AI によって生成されたビデオは、ショート ビデオ制作、映画製作、パーソナ … 続きを読む
カテゴリー: cs.CV
V2A-Mark: Versatile Deep Visual-Audio Watermarking for Manipulation Localization and Copyright Protection はコメントを受け付けていません
Spider: Any-to-Many Multimodal LLM
要約 マルチモーダル LLM (MLLM) は、大規模言語モデル (LLM) の … 続きを読む
カテゴリー: cs.CV
Spider: Any-to-Many Multimodal LLM はコメントを受け付けていません
SMILE-UHURA Challenge — Small Vessel Segmentation at Mesoscopic Scale from Ultra-High Resolution 7T Magnetic Resonance Angiograms
要約 人間の脳は、複雑な血管ネットワークを通じて栄養素と酸素を受け取ります。 メ … 続きを読む
Stable Consistency Tuning: Understanding and Improving Consistency Models
要約 拡散モデルは優れた生成品質を実現しますが、ノイズ除去の反復的な性質により生 … 続きを読む
LLaMA-Mesh: Unifying 3D Mesh Generation with Language Models
要約 この研究では、テキストで事前トレーニングされた大規模言語モデル (LLM) … 続きを読む
Assessing the Performance of the DINOv2 Self-supervised Learning Vision Transformer Model for the Segmentation of the Left Atrium from MRI Images
要約 術前スキャンからの正確な左心房 (LA) セグメンテーションは、心房細動の … 続きを読む