投稿者「jarxiv」のアーカイブ

Conditional Panoramic Image Generation via Masked Autoregressive Modeling

投稿日: 2025年5月23日作成者: jarxiv

要約パノラマ画像生成の最近の進歩は、既存のアプローチにおける2つの重要な制限を … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Training-Free Efficient Video Generation via Dynamic Token Carving

投稿日: 2025年5月23日作成者: jarxiv

要約ビデオ拡散トランス（DIT）モデルの顕著な生成品質にもかかわらず、それらの … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

T2I-ConBench: Text-to-Image Benchmark for Continual Post-training

投稿日: 2025年5月23日作成者: jarxiv

要約継続的なトレーニング後のテキストから画像間拡散モデルを適応させて、個別のモ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Tracking the Flight: Exploring a Computational Framework for Analyzing Escape Responses in Plains Zebra (Equus quagga)

投稿日: 2025年5月23日作成者: jarxiv

要約エステル研究は、ドローンの手頃な価格とアクセシビリティの高まりによりますま … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

MindGYM: What Matters in Question Synthesis for Thinking-Centric Fine-Tuning?

投稿日: 2025年5月23日作成者: jarxiv

要約大規模なファンデーションモデルは、特に剛性テンプレートまたは群衆発表の命令 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Remote Sensing Spatio-Temporal Vision-Language Models: A Comprehensive Survey

投稿日: 2025年5月23日作成者: jarxiv

要約多時代のリモートセンシング画像の解釈は、バイナリまたはセマンティックマスク … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

RealEngine: Simulating Autonomous Driving in Realistic Context

投稿日: 2025年5月23日作成者: jarxiv

要約運転シミュレーションは、制御された評価環境を提供することにより、信頼できる … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

DetailMaster: Can Your Text-to-Image Model Handle Long Prompts?

投稿日: 2025年5月23日作成者: jarxiv

要約最近のテキストからイメージ（T2I）モデルは、簡単な説明から画像を合成する … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Backdoor Cleaning without External Guidance in MLLM Fine-tuning

投稿日: 2025年5月23日作成者: jarxiv

要約マルチモーダル大手言語モデル（MLLMS）は、ユーザーがサビされたデータセ … 続きを読む →

カテゴリー: cs.CR, cs.CV | コメントを受け付けていません

L2RDaS: Synthesizing 4D Radar Tensors for Model Generalization via Dataset Expansion

投稿日: 2025年5月23日作成者: jarxiv

要約 4次元（4D）レーダーは、有害な気象条件下での堅牢性により、知覚タスクの自 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

Conditional Panoramic Image Generation via Masked Autoregressive Modeling

Training-Free Efficient Video Generation via Dynamic Token Carving

T2I-ConBench: Text-to-Image Benchmark for Continual Post-training

Tracking the Flight: Exploring a Computational Framework for Analyzing Escape Responses in Plains Zebra (Equus quagga)

MindGYM: What Matters in Question Synthesis for Thinking-Centric Fine-Tuning?

Remote Sensing Spatio-Temporal Vision-Language Models: A Comprehensive Survey

RealEngine: Simulating Autonomous Driving in Realistic Context

DetailMaster: Can Your Text-to-Image Model Handle Long Prompts?

Backdoor Cleaning without External Guidance in MLLM Fine-tuning

L2RDaS: Synthesizing 4D Radar Tensors for Model Generalization via Dataset Expansion

最近の投稿

最近のコメント

アーカイブ

カテゴリー