cs.CV」カテゴリーアーカイブ

Reliable Breast Cancer Molecular Subtype Prediction based on uncertainty-aware Bayesian Deep Learning by Mammography

要約 乳がんは、分子サブタイプ、臨床的挙動、治療反応、生存転帰が異なる不均一な疾 … 続きを読む

カテゴリー: cs.CV | Reliable Breast Cancer Molecular Subtype Prediction based on uncertainty-aware Bayesian Deep Learning by Mammography はコメントを受け付けていません

Gramian Multimodal Representation Learning and Alignment

要約 人間の知覚は、視覚、聴覚、言語などの複数のモダリティを統合して、周囲の現実 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Gramian Multimodal Representation Learning and Alignment はコメントを受け付けていません

GSDiff: Synthesizing Vector Floorplans via Geometry-enhanced Structural Graph Generation

要約 建築フロアプラン設計の自動化は住宅やインテリアの設計にとって不可欠であり、 … 続きを読む

カテゴリー: cs.CV, cs.GR | GSDiff: Synthesizing Vector Floorplans via Geometry-enhanced Structural Graph Generation はコメントを受け付けていません

Controllable Shadow Generation with Single-Step Diffusion Models from Synthetic Data

要約 リアルな影の生成は、高品質の画像合成と視覚効果にとって重要なコンポーネント … 続きを読む

カテゴリー: cs.CV | Controllable Shadow Generation with Single-Step Diffusion Models from Synthetic Data はコメントを受け付けていません

Emma-X: An Embodied Multimodal Action Model with Grounded Chain of Thought and Look-ahead Spatial Reasoning

要約 従来の強化学習ベースのロボット制御手法はタスク固有であることが多く、多様な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.RO | Emma-X: An Embodied Multimodal Action Model with Grounded Chain of Thought and Look-ahead Spatial Reasoning はコメントを受け付けていません

EmotiveTalk: Expressive Talking Head Generation through Audio Information Decoupling and Emotional Video Diffusion

要約 拡散モデルはトーキング ヘッド生成の分野に革命をもたらしましたが、表現力、 … 続きを読む

カテゴリー: cs.AI, cs.CV | EmotiveTalk: Expressive Talking Head Generation through Audio Information Decoupling and Emotional Video Diffusion はコメントを受け付けていません

SAMIC: Segment Anything with In-Context Spatial Prompt Engineering

要約 フューショット セグメンテーションは、ラベル付けされた参照画像の小さなセッ … 続きを読む

カテゴリー: cs.CV | SAMIC: Segment Anything with In-Context Spatial Prompt Engineering はコメントを受け付けていません

LLM-RG4: Flexible and Factual Radiology Report Generation across Diverse Input Contexts

要約 放射線医学レポートの作成は柔軟性を必要とする複雑なタスクであり、放射線科医 … 続きを読む

カテゴリー: cs.CL, cs.CV | LLM-RG4: Flexible and Factual Radiology Report Generation across Diverse Input Contexts はコメントを受け付けていません

COSMo: CLIP Talks on Open-Set Multi-Target Domain Adaptation

要約 マルチターゲット ドメイン アダプテーション (MTDA) では、単一のソ … 続きを読む

カテゴリー: cs.CV | COSMo: CLIP Talks on Open-Set Multi-Target Domain Adaptation はコメントを受け付けていません

RepFace: Refining Closed-Set Noise with Progressive Label Correction for Face Recognition

要約 顔認識は、データセットの規模の拡大、さまざまなバックボーンの進歩、および識 … 続きを読む

カテゴリー: cs.CV | RepFace: Refining Closed-Set Noise with Progressive Label Correction for Face Recognition はコメントを受け付けていません