-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Watch and Learn: Leveraging Expert Knowledge and Language for Surgical Video Understanding
要約 自動手術ワークフロー分析は、教育、研究、臨床的意思決定には重要ですが、注釈 … 続きを読む
カテゴリー: cs.CV
Watch and Learn: Leveraging Expert Knowledge and Language for Surgical Video Understanding はコメントを受け付けていません
Towards Sample-specific Backdoor Attack with Clean Labels via Attribute Trigger
要約 現在、サンプル固有のバックドア攻撃(SSBA)は、現在のバックドア防御のほ … 続きを読む
RectifiedHR: Enable Efficient High-Resolution Image Generation via Energy Rectification
要約 拡散モデルは、さまざまな画像生成タスクで顕著な進歩を達成しています。 ただ … 続きを読む
A Framework for a Capability-driven Evaluation of Scenario Understanding for Multimodal Large Language Models in Autonomous Driving
要約 マルチモーダル大手言語モデル(MLLM)は、ドメインに依存しない世界知識と … 続きを読む
Towards A Correct Usage of Cryptography in Semantic Watermarks for Diffusion Models
要約 セマンティックの透かしの方法により、初期潜在ノイズを変更するだけで、潜在拡 … 続きを読む
LuSeg: Efficient Negative and Positive Obstacles Segmentation via Contrast-Driven Multi-Modal Feature Fusion on the Lunar
要約 月の探査ミッションがますます複雑になるにつれて、安全で自律的なローバーベー … 続きを読む
MTV-Inpaint: Multi-Task Long Video Inpainting
要約 ビデオの開始には、ビデオ内のローカル領域を変更し、空間的および時間的な一貫 … 続きを読む
カテゴリー: cs.CV
MTV-Inpaint: Multi-Task Long Video Inpainting はコメントを受け付けていません
Category Prompt Mamba Network for Nuclei Segmentation and Classification
要約 核のセグメンテーションと分類は、腫瘍免疫微小環境分析に不可欠な基盤を提供し … 続きを読む
カテゴリー: cs.CV
Category Prompt Mamba Network for Nuclei Segmentation and Classification はコメントを受け付けていません
VideoTree: Adaptive Tree-based Video Representation for LLM Reasoning on Long Videos
要約 長型のビデオ理解は、ビデオデータの冗長性が高いことと、クエリと関係のある情 … 続きを読む
AQUA-SLAM: Tightly-Coupled Underwater Acoustic-Visual-Inertial SLAM with Sensor Calibration
要約 水中環境は、視認性が限られていること、不十分な照明、および画像の構造的特徴 … 続きを読む