-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年3月
Tuning-Free Multi-Event Long Video Generation via Synchronized Coupled Sampling
要約 テキストからビデオへの拡散モデルの最近の進歩により、単一のプロンプトから高 … 続きを読む
Curriculum Direct Preference Optimization for Diffusion and Consistency Models
要約 直接選好最適化(DPO)は、人間のフィードバック(RLHF)からの強化学習 … 続きを読む
Vision Transformer for Intracranial Hemorrhage Classification in CT Scans Using an Entropy-Aware Fuzzy Integral Strategy for Adaptive Scan-Level Decision Fusion
要約 頭蓋内出血(ICH)は、脳血管の破裂によって引き起こされる重大な医学的緊急 … 続きを読む
HO-Cap: A Capture System and Dataset for 3D Reconstruction and Pose Tracking of Hand-Object Interaction
要約 3D再構成のために、データキャプチャシステムと新しいデータセット、HO-C … 続きを読む
カテゴリー: cs.CV
HO-Cap: A Capture System and Dataset for 3D Reconstruction and Pose Tracking of Hand-Object Interaction はコメントを受け付けていません
INPC: Implicit Neural Point Clouds for Radiance Field Rendering
要約 未結合の実世界のシーンの再構築と新しいビューの統合のための新しいアプローチ … 続きを読む
HiP-AD: Hierarchical and Multi-Granularity Planning with Deformable Attention for Autonomous Driving in a Single Decoder
要約 エンドツーエンドの自律運転(E2E-AD)テクノロジーは近年大きな進歩を遂 … 続きを読む
LightGen: Efficient Image Generation through Knowledge Distillation and Direct Preference Optimization
要約 テキストからイメージの生成の最近の進歩は、主に広範なデータセットとパラメー … 続きを読む
カテゴリー: cs.CV
LightGen: Efficient Image Generation through Knowledge Distillation and Direct Preference Optimization はコメントを受け付けていません
RealmDreamer: Text-Driven 3D Scene Generation with Inpainting and Depth Diffusion
要約 Textの説明から前向きな3Dシーンを生成するためのテクニックであるRea … 続きを読む
SegAgent: Exploring Pixel Understanding Capabilities in MLLMs by Imitating Human Annotator Trajectories
要約 MLLMは適切な画像理解機能を実証していますが、Pixelレベルの理解に苦 … 続きを読む
カテゴリー: cs.CV
SegAgent: Exploring Pixel Understanding Capabilities in MLLMs by Imitating Human Annotator Trajectories はコメントを受け付けていません
PanoDreamer: Optimization-Based Single Image to 360 3D Scene With Diffusion
要約 この論文では、単一の入力画像からコヒーレント360 {\ deg} 3Dシ … 続きを読む