-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年4月
HYPE: Hyperbolic Entailment Filtering for Underspecified Images and Texts
要約 データ量が自己教師あり学習の有効性を高める時代では、データ セマンティクス … 続きを読む
カテゴリー: cs.CV
HYPE: Hyperbolic Entailment Filtering for Underspecified Images and Texts はコメントを受け付けていません
Probing Conceptual Understanding of Large Visual-Language Models
要約 近年、大規模なビジュアル言語 (V+L) モデルがさまざまな下流タスクで大 … 続きを読む
カテゴリー: cs.CV
Probing Conceptual Understanding of Large Visual-Language Models はコメントを受け付けていません
DeepClean: Machine Unlearning on the Cheap by Resetting Privacy Sensitive Weights using the Fisher Diagonal
要約 機密データや個人データでトレーニングされた機械学習モデルは、その情報を誤っ … 続きを読む
MAIRA-1: A specialised large multimodal model for radiology report generation
要約 胸部 X 線 (CXR) から放射線医学レポートを生成するタスクのための放 … 続きを読む
Ag2Manip: Learning Novel Manipulation Skills with Agent-Agnostic Visual and Action Representations
要約 新しい操作タスクを学習できる自律型ロボット システムは、産業を製造からサー … 続きを読む
ChemScraper: Leveraging PDF Graphics Instructions for Molecular Diagram Parsing
要約 ほとんどの分子図パーサーは、ラスター画像 (PNG など) から化学構造を … 続きを読む
カテゴリー: cs.CV
ChemScraper: Leveraging PDF Graphics Instructions for Molecular Diagram Parsing はコメントを受け付けていません
Geometry-aware Reconstruction and Fusion-refined Rendering for Generalizable Neural Radiance Fields
要約 一般化可能な NeRF は、目に見えないシーンに対して新しいビューを合成す … 続きを読む
カテゴリー: cs.CV
Geometry-aware Reconstruction and Fusion-refined Rendering for Generalizable Neural Radiance Fields はコメントを受け付けていません
CT-GLIP: 3D Grounded Language-Image Pretraining with CT Scans and Radiology Reports for Full-Body Scenarios
要約 Medical Vision-Language Pretraining ( … 続きを読む
Exploring the Distinctiveness and Fidelity of the Descriptions Generated by Large Vision-Language Models
要約 Large Vision-Language Model (LVLM) は、 … 続きを読む
Overload: Latency Attacks on Object Detection for Edge Devices
要約 現在、インテリジェント サービスに対する需要が高まっているため、ディープ … 続きを読む
カテゴリー: cs.CV
Overload: Latency Attacks on Object Detection for Edge Devices はコメントを受け付けていません