cs.CV」カテゴリーアーカイブ

Evaluating and Improving the Effectiveness of Synthetic Chest X-Rays for Medical Image Analysis

要約 目的: 合成胸部 X 線画像を生成し、医療画像データセットを増強して、分類 … 続きを読む

カテゴリー: cs.CV, eess.IV | Evaluating and Improving the Effectiveness of Synthetic Chest X-Rays for Medical Image Analysis はコメントを受け付けていません

CAT4D: Create Anything in 4D with Multi-View Video Diffusion Models

要約 単眼ビデオから 4D (ダイナミック 3D) シーンを作成する方法である … 続きを読む

カテゴリー: cs.CV | CAT4D: Create Anything in 4D with Multi-View Video Diffusion Models はコメントを受け付けていません

Proactive Gradient Conflict Mitigation in Multi-Task Learning: A Sparse Training Perspective

要約 ジェネラリスト エージェントへの進化には、統合モデルを使用した複数のタスク … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Proactive Gradient Conflict Mitigation in Multi-Task Learning: A Sparse Training Perspective はコメントを受け付けていません

DINO-LG: A Task-Specific DINO Model for Coronary Calcium Scoring

要約 冠動脈疾患 (CAD) は世界中の主な死亡原因の 1 つであり、効果的なリ … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | DINO-LG: A Task-Specific DINO Model for Coronary Calcium Scoring はコメントを受け付けていません

Diffusion Self-Distillation for Zero-Shot Customized Image Generation

要約 テキストから画像への拡散モデルは印象的な結果を生み出しますが、きめ細かい制 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | Diffusion Self-Distillation for Zero-Shot Customized Image Generation はコメントを受け付けていません

Cross-modal Information Flow in Multimodal Large Language Models

要約 自己回帰マルチモーダル大規模言語モデル (MLLM) の最近の進歩により、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Cross-modal Information Flow in Multimodal Large Language Models はコメントを受け付けていません

Leveraging Semi-Supervised Learning to Enhance Data Mining for Image Classification under Limited Labeled Data

要約 21世紀の情報化時代では、ビッグデータ技術の発展に伴い、大量のデータから価 … 続きを読む

カテゴリー: cs.CV, cs.LG | Leveraging Semi-Supervised Learning to Enhance Data Mining for Image Classification under Limited Labeled Data はコメントを受け付けていません

Lift3D Foundation Policy: Lifting 2D Large-Scale Pretrained Models for Robust 3D Robotic Manipulation

要約 ロボットは 3D 環境を認識し、空間関係を推論し、複雑な空間構成と対話する … 続きを読む

カテゴリー: cs.CV | Lift3D Foundation Policy: Lifting 2D Large-Scale Pretrained Models for Robust 3D Robotic Manipulation はコメントを受け付けていません

GeneMAN: Generalizable Single-Image 3D Human Reconstruction from Multi-Source Human Data

要約 野生の人間の写真が 1 枚ある場合、忠実度の高い 3D 人体モデルを再構築 … 続きを読む

カテゴリー: cs.CV | GeneMAN: Generalizable Single-Image 3D Human Reconstruction from Multi-Source Human Data はコメントを受け付けていません

Textured Gaussians for Enhanced 3D Scene Appearance Modeling

要約 3D ガウス スプラッティング (3DGS) は、高品質の結果と高速なトレ … 続きを読む

カテゴリー: cs.CV | Textured Gaussians for Enhanced 3D Scene Appearance Modeling はコメントを受け付けていません