-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Evaluating and Improving the Effectiveness of Synthetic Chest X-Rays for Medical Image Analysis
要約 目的: 合成胸部 X 線画像を生成し、医療画像データセットを増強して、分類 … 続きを読む
CAT4D: Create Anything in 4D with Multi-View Video Diffusion Models
要約 単眼ビデオから 4D (ダイナミック 3D) シーンを作成する方法である … 続きを読む
カテゴリー: cs.CV
CAT4D: Create Anything in 4D with Multi-View Video Diffusion Models はコメントを受け付けていません
Proactive Gradient Conflict Mitigation in Multi-Task Learning: A Sparse Training Perspective
要約 ジェネラリスト エージェントへの進化には、統合モデルを使用した複数のタスク … 続きを読む
DINO-LG: A Task-Specific DINO Model for Coronary Calcium Scoring
要約 冠動脈疾患 (CAD) は世界中の主な死亡原因の 1 つであり、効果的なリ … 続きを読む
Diffusion Self-Distillation for Zero-Shot Customized Image Generation
要約 テキストから画像への拡散モデルは印象的な結果を生み出しますが、きめ細かい制 … 続きを読む
Cross-modal Information Flow in Multimodal Large Language Models
要約 自己回帰マルチモーダル大規模言語モデル (MLLM) の最近の進歩により、 … 続きを読む
Leveraging Semi-Supervised Learning to Enhance Data Mining for Image Classification under Limited Labeled Data
要約 21世紀の情報化時代では、ビッグデータ技術の発展に伴い、大量のデータから価 … 続きを読む
Lift3D Foundation Policy: Lifting 2D Large-Scale Pretrained Models for Robust 3D Robotic Manipulation
要約 ロボットは 3D 環境を認識し、空間関係を推論し、複雑な空間構成と対話する … 続きを読む
カテゴリー: cs.CV
Lift3D Foundation Policy: Lifting 2D Large-Scale Pretrained Models for Robust 3D Robotic Manipulation はコメントを受け付けていません
GeneMAN: Generalizable Single-Image 3D Human Reconstruction from Multi-Source Human Data
要約 野生の人間の写真が 1 枚ある場合、忠実度の高い 3D 人体モデルを再構築 … 続きを読む
カテゴリー: cs.CV
GeneMAN: Generalizable Single-Image 3D Human Reconstruction from Multi-Source Human Data はコメントを受け付けていません
Textured Gaussians for Enhanced 3D Scene Appearance Modeling
要約 3D ガウス スプラッティング (3DGS) は、高品質の結果と高速なトレ … 続きを読む
カテゴリー: cs.CV
Textured Gaussians for Enhanced 3D Scene Appearance Modeling はコメントを受け付けていません