-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年2月
A Brief Analysis of the Iterative Next Boundary Detection Network for Tree Rings Delineation in Images of Pinus taeda
要約 本研究では、CVPR-2023においてGillertらによって提案されたI … 続きを読む
SelfFed: Self-Supervised Federated Learning for Data Heterogeneity and Label Scarcity in Medical Images
要約 連合学習パラダイムにおける自己教師付き学習は、ラベル付けされていない孤立し … 続きを読む
TUMTraffic-VideoQA: A Benchmark for Unified Spatio-Temporal Video Understanding in Traffic Scenes
要約 TUMTraffic-VideoQAは、複雑な道路交通シナリオにおける時空 … 続きを読む
カテゴリー: cs.CV
TUMTraffic-VideoQA: A Benchmark for Unified Spatio-Temporal Video Understanding in Traffic Scenes はコメントを受け付けていません
Personalization Toolkit: Training Free Personalization of Large Vision Language Models
要約 ラージビジョン言語モデル(LVLM)は、個々のユーザーのユニークなニーズや … 続きを読む
カテゴリー: cs.CV
Personalization Toolkit: Training Free Personalization of Large Vision Language Models はコメントを受け付けていません
IMDPrompter: Adapting SAM to Image Manipulation Detection by Cross-View Automated Prompt Learning
要約 SA-1Bの膨大な学習データを用いたセグメント何でもモデル(SAM)は、卓 … 続きを読む
カテゴリー: cs.CV
IMDPrompter: Adapting SAM to Image Manipulation Detection by Cross-View Automated Prompt Learning はコメントを受け付けていません
SAISA: Towards Multimodal Large Language Models with Both Training and Inference Efficiency
要約 マルチモーダル大規模言語モデル(MLLM)は主に2つのアーキテクチャに分類 … 続きを読む
Towards Consistent and Controllable Image Synthesis for Face Editing
要約 現在の顔編集手法は主にGANベースの手法に依存しているが、最近では画像再構 … 続きを読む
カテゴリー: cs.CV
Towards Consistent and Controllable Image Synthesis for Face Editing はコメントを受け付けていません
High-Fidelity Human Avatars from Laptop Webcams using Edge Compute
要約 フォトリアリスティックな人間アバターを生成する用途は数多くあるが、高忠実度 … 続きを読む
カテゴリー: cs.CV
High-Fidelity Human Avatars from Laptop Webcams using Edge Compute はコメントを受け付けていません
Mind the Gap: Evaluating Patch Embeddings from General-Purpose and Histopathology Foundation Models for Cell Segmentation and Classification
要約 最近の基礎モデルの進歩はコンピュータ・ビジョンに変革をもたらし、デジタル病 … 続きを読む
Monocular Per-Object Distance Estimation with Masked Object Modeling
要約 物体ごとの距離推定は、安全性が極めて重要な監視や自律走行において重要である … 続きを読む
カテゴリー: cs.CV
Monocular Per-Object Distance Estimation with Masked Object Modeling はコメントを受け付けていません