-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年2月
Personalized Image Generation with Deep Generative Models: A Decade Survey
要約 生成モデルの最近の進歩により、パーソナライズされたコンテンツ作成の開発が大 … 続きを読む
カテゴリー: cs.CV
Personalized Image Generation with Deep Generative Models: A Decade Survey はコメントを受け付けていません
Scene Aware Person Image Generation through Global Contextual Conditioning
要約 人のイメージ生成は、興味をそそるが挑戦的な問題です。 ただし、制約された状 … 続きを読む
Ctrl-U: Robust Conditional Image Generation via Uncertainty-aware Reward Modeling
要約 この論文では、ユーザーの指示に従って画像が合成される条件付き画像生成のタス … 続きを読む
カテゴリー: cs.CV
Ctrl-U: Robust Conditional Image Generation via Uncertainty-aware Reward Modeling はコメントを受け付けていません
Semantically Consistent Person Image Generation
要約 コンテキストを認識している人の画像生成のためのデータ駆動型アプローチを提案 … 続きを読む
Understanding and Rectifying Safety Perception Distortion in VLMs
要約 最近の研究では、ビジョンモデル(VLM)がビジョンモダリティを統合した後、 … 続きを読む
WeedsGalore: A Multispectral and Multitemporal UAV-based Dataset for Crop and Weed Segmentation in Agricultural Maize Fields
要約 雑草は、収穫量の損失の主な理由の1つですが、現在の除草習慣は効率的かつ標的 … 続きを読む
カテゴリー: cs.CV
WeedsGalore: A Multispectral and Multitemporal UAV-based Dataset for Crop and Weed Segmentation in Agricultural Maize Fields はコメントを受け付けていません
STAR: Scale-wise Text-conditioned AutoRegressive image generation
要約 スケールごとの自動回帰パラダイムを使用するテキストから画像モデルであるSt … 続きを読む
カテゴリー: cs.CV
STAR: Scale-wise Text-conditioned AutoRegressive image generation はコメントを受け付けていません
Is Noise Conditioning Necessary for Denoising Generative Models?
要約 ノイズコンディショニングは、拡散モデルを除去するには不可欠であると広く信じ … 続きを読む
カテゴリー: cs.CV
Is Noise Conditioning Necessary for Denoising Generative Models? はコメントを受け付けていません
Magma: A Foundation Model for Multimodal AI Agents
要約 マグマは、デジタルワールドと物理世界の両方でマルチモーダルAIエージェント … 続きを読む
AV-Flow: Transforming Text to Audio-Visual Human-like Interactions
要約 テキスト入力のみが与えられた写真と現実的な4Dトーキングアバターをアニメー … 続きを読む
カテゴリー: cs.CV
AV-Flow: Transforming Text to Audio-Visual Human-like Interactions はコメントを受け付けていません