-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Reliable Breast Cancer Molecular Subtype Prediction based on uncertainty-aware Bayesian Deep Learning by Mammography
要約 乳がんは、分子サブタイプ、臨床的挙動、治療反応、生存転帰が異なる不均一な疾 … 続きを読む
カテゴリー: cs.CV
Reliable Breast Cancer Molecular Subtype Prediction based on uncertainty-aware Bayesian Deep Learning by Mammography はコメントを受け付けていません
Gramian Multimodal Representation Learning and Alignment
要約 人間の知覚は、視覚、聴覚、言語などの複数のモダリティを統合して、周囲の現実 … 続きを読む
GSDiff: Synthesizing Vector Floorplans via Geometry-enhanced Structural Graph Generation
要約 建築フロアプラン設計の自動化は住宅やインテリアの設計にとって不可欠であり、 … 続きを読む
Controllable Shadow Generation with Single-Step Diffusion Models from Synthetic Data
要約 リアルな影の生成は、高品質の画像合成と視覚効果にとって重要なコンポーネント … 続きを読む
カテゴリー: cs.CV
Controllable Shadow Generation with Single-Step Diffusion Models from Synthetic Data はコメントを受け付けていません
Emma-X: An Embodied Multimodal Action Model with Grounded Chain of Thought and Look-ahead Spatial Reasoning
要約 従来の強化学習ベースのロボット制御手法はタスク固有であることが多く、多様な … 続きを読む
EmotiveTalk: Expressive Talking Head Generation through Audio Information Decoupling and Emotional Video Diffusion
要約 拡散モデルはトーキング ヘッド生成の分野に革命をもたらしましたが、表現力、 … 続きを読む
SAMIC: Segment Anything with In-Context Spatial Prompt Engineering
要約 フューショット セグメンテーションは、ラベル付けされた参照画像の小さなセッ … 続きを読む
カテゴリー: cs.CV
SAMIC: Segment Anything with In-Context Spatial Prompt Engineering はコメントを受け付けていません
LLM-RG4: Flexible and Factual Radiology Report Generation across Diverse Input Contexts
要約 放射線医学レポートの作成は柔軟性を必要とする複雑なタスクであり、放射線科医 … 続きを読む
COSMo: CLIP Talks on Open-Set Multi-Target Domain Adaptation
要約 マルチターゲット ドメイン アダプテーション (MTDA) では、単一のソ … 続きを読む
カテゴリー: cs.CV
COSMo: CLIP Talks on Open-Set Multi-Target Domain Adaptation はコメントを受け付けていません
RepFace: Refining Closed-Set Noise with Progressive Label Correction for Face Recognition
要約 顔認識は、データセットの規模の拡大、さまざまなバックボーンの進歩、および識 … 続きを読む
カテゴリー: cs.CV
RepFace: Refining Closed-Set Noise with Progressive Label Correction for Face Recognition はコメントを受け付けていません