-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年2月
Step-Video-T2V Technical Report: The Practice, Challenges, and Future of Video Foundation Model
要約 30Bパラメーターと最大204フレームの長さまでのビデオを生成する機能を備 … 続きを読む
Local-Prompt: Extensible Local Prompts for Few-Shot Out-of-Distribution Detection
要約 外れ方(OOD)検出は、既知のカテゴリと既知のカテゴリを区別することを目的 … 続きを読む
カテゴリー: cs.CV
Local-Prompt: Extensible Local Prompts for Few-Shot Out-of-Distribution Detection はコメントを受け付けていません
VisCon-100K: Leveraging Contextual Web Data for Fine-tuning Vision Language Models
要約 ビジョン言語モデル(VLM)は、さまざまな視覚ベンチマークで優れていますが … 続きを読む
PromptArtisan: Multi-instruction Image Editing in Single Pass with Complete Attention Control
要約 私たちは、単一のパスで顕著な結果を達成するマルチインストラクション画像編集 … 続きを読む
MITO: Enabling Non-Line-of-Sight Perception using Millimeter-waves through Real-World Datasets and Simulation Tools
要約 日常のオブジェクトのマルチスペクトルミリ波(mmwave)画像の最初のデー … 続きを読む
カテゴリー: cs.CV
MITO: Enabling Non-Line-of-Sight Perception using Millimeter-waves through Real-World Datasets and Simulation Tools はコメントを受け付けていません
Probing Perceptual Constancy in Large Vision Language Models
要約 知覚的恒常性とは、距離、角度、照明の変動など、感覚入力の変化にもかかわらず … 続きを読む
Artificial Intelligence to Assess Dental Findings from Panoramic Radiographs — A Multinational Study
要約 歯科用パノラマX線写真(DPR)は、包括的な口頭評価のために臨床診療で広く … 続きを読む
カテゴリー: cs.CV
Artificial Intelligence to Assess Dental Findings from Panoramic Radiographs — A Multinational Study はコメントを受け付けていません
QMaxViT-Unet+: A Query-Based MaxViT-Unet with Edge Enhancement for Scribble-Supervised Segmentation of Medical Images
要約 医療画像セグメンテーションのための高度なディープラーニングモデルの展開は、 … 続きを読む
カテゴリー: cs.CV
QMaxViT-Unet+: A Query-Based MaxViT-Unet with Edge Enhancement for Scribble-Supervised Segmentation of Medical Images はコメントを受け付けていません
SPIRIT: Short-term Prediction of solar IRradIance for zero-shot Transfer learning using Foundation Models
要約 従来のソーラー予測モデルは、数年のサイト固有の歴史的放射照度データに基づい … 続きを読む
Object Detection and Tracking
要約 効率的で正確なオブジェクト検出は、コンピュータービジョンシステムの開発にお … 続きを読む