-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Conditional Panoramic Image Generation via Masked Autoregressive Modeling
要約 パノラマ画像生成の最近の進歩は、既存のアプローチにおける2つの重要な制限を … 続きを読む
カテゴリー: cs.CV
Conditional Panoramic Image Generation via Masked Autoregressive Modeling はコメントを受け付けていません
Training-Free Efficient Video Generation via Dynamic Token Carving
要約 ビデオ拡散トランス(DIT)モデルの顕著な生成品質にもかかわらず、それらの … 続きを読む
カテゴリー: cs.CV
Training-Free Efficient Video Generation via Dynamic Token Carving はコメントを受け付けていません
T2I-ConBench: Text-to-Image Benchmark for Continual Post-training
要約 継続的なトレーニング後のテキストから画像間拡散モデルを適応させて、個別のモ … 続きを読む
Tracking the Flight: Exploring a Computational Framework for Analyzing Escape Responses in Plains Zebra (Equus quagga)
要約 エステル研究は、ドローンの手頃な価格とアクセシビリティの高まりによりますま … 続きを読む
カテゴリー: cs.CV
Tracking the Flight: Exploring a Computational Framework for Analyzing Escape Responses in Plains Zebra (Equus quagga) はコメントを受け付けていません
MindGYM: What Matters in Question Synthesis for Thinking-Centric Fine-Tuning?
要約 大規模なファンデーションモデルは、特に剛性テンプレートまたは群衆発表の命令 … 続きを読む
Remote Sensing Spatio-Temporal Vision-Language Models: A Comprehensive Survey
要約 多時代のリモートセンシング画像の解釈は、バイナリまたはセマンティックマスク … 続きを読む
カテゴリー: cs.CV
Remote Sensing Spatio-Temporal Vision-Language Models: A Comprehensive Survey はコメントを受け付けていません
RealEngine: Simulating Autonomous Driving in Realistic Context
要約 運転シミュレーションは、制御された評価環境を提供することにより、信頼できる … 続きを読む
DetailMaster: Can Your Text-to-Image Model Handle Long Prompts?
要約 最近のテキストからイメージ(T2I)モデルは、簡単な説明から画像を合成する … 続きを読む
Backdoor Cleaning without External Guidance in MLLM Fine-tuning
要約 マルチモーダル大手言語モデル(MLLMS)は、ユーザーがサビされたデータセ … 続きを読む
L2RDaS: Synthesizing 4D Radar Tensors for Model Generalization via Dataset Expansion
要約 4次元(4D)レーダーは、有害な気象条件下での堅牢性により、知覚タスクの自 … 続きを読む