-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年2月
GaMeS: Mesh-Based Adapting and Modification of Gaussian Splatting
要約 近年、画像レンダリングのためのニューラル ネットワーク ベースのさまざまな … 続きを読む
カテゴリー: cs.CV
GaMeS: Mesh-Based Adapting and Modification of Gaussian Splatting はコメントを受け付けていません
AnomalyCLIP: Object-agnostic Prompt Learning for Zero-shot Anomaly Detection
要約 ゼロショット異常検出 (ZSAD) では、ターゲット データセット内のトレ … 続きを読む
カテゴリー: cs.CV
AnomalyCLIP: Object-agnostic Prompt Learning for Zero-shot Anomaly Detection はコメントを受け付けていません
OVOR: OnePrompt with Virtual Outlier Regularization for Rehearsal-Free Class-Incremental Learning
要約 最近の研究では、学習可能なプロンプトとともに大規模な事前トレーニング済みモ … 続きを読む
Beyond Hallucinations: Enhancing LVLMs through Hallucination-Aware Direct Preference Optimization
要約 マルチモーダル大規模言語モデルは近年大幅な進歩を遂げていますが、依然として … 続きを読む
U-shaped Vision Mamba for Single Image Dehazing
要約 現在、Transformer は画像のかすみ除去用の最も一般的なアーキテク … 続きを読む
カテゴリー: cs.CV
U-shaped Vision Mamba for Single Image Dehazing はコメントを受け付けていません
MI-SegNet: Mutual Information-Based US Segmentation for Unseen Domain Generalization
要約 ドメイン全体にわたる学習ベースの医用画像セグメンテーションの一般化機能は、 … 続きを読む
Informed Reinforcement Learning for Situation-Aware Traffic Rule Exceptions
要約 強化学習は、将来が期待される非常に活発な研究分野です。 ただし、自動運転の … 続きを読む
3D Volumetric Super-Resolution in Radiology Using 3D RRDB-GAN
要約 この研究では、放射線画像の 3D 超解像度のための 3D Residual … 続きを読む
SHIELD : An Evaluation Benchmark for Face Spoofing and Forgery Detection with Multimodal Large Language Models
要約 マルチモーダル大規模言語モデル (MLLM) は、強力な視覚的意味表現と言 … 続きを読む
カテゴリー: cs.CV
SHIELD : An Evaluation Benchmark for Face Spoofing and Forgery Detection with Multimodal Large Language Models はコメントを受け付けていません
ViT-DD: Multi-Task Vision Transformer for Semi-Supervised Driver Distraction Detection
要約 現代の運転における交通安全の確保と事故の軽減は最も重要であり、コンピュータ … 続きを読む
カテゴリー: cs.CV
ViT-DD: Multi-Task Vision Transformer for Semi-Supervised Driver Distraction Detection はコメントを受け付けていません