-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年5月
Fact-R1: Towards Explainable Video Misinformation Detection with Deep Reasoning
要約 ソーシャルメディアでのマルチモーダル誤った情報の急速な広がりは、懸念の高ま … 続きを読む
LaViDa: A Large Diffusion Language Model for Multimodal Understanding
要約 最新のビジョン言語モデル(VLM)は、視覚的な推論を必要とする幅広いタスク … 続きを読む
カテゴリー: cs.CV
LaViDa: A Large Diffusion Language Model for Multimodal Understanding はコメントを受け付けていません
More Text, Less Point: Towards 3D Data-Efficient Point-Language Understanding
要約 大規模な言語モデル(LLM)が3Dの物理的世界を理解できるようにすることは … 続きを読む
ATR-Bench: A Federated Learning Benchmark for Adaptation, Trust, and Reasoning
要約 Federated Learning(FL)は、分散型の参加者全体でデータ … 続きを読む
Think or Not? Selective Reasoning via Reinforcement Learning for Vision-Language Models
要約 強化学習(RL)は、ビジョン言語モデル(VLM)の推論を強化するための効果 … 続きを読む
Conditional Panoramic Image Generation via Masked Autoregressive Modeling
要約 パノラマ画像生成の最近の進歩は、既存のアプローチにおける2つの重要な制限を … 続きを読む
カテゴリー: cs.CV
Conditional Panoramic Image Generation via Masked Autoregressive Modeling はコメントを受け付けていません
Training-Free Efficient Video Generation via Dynamic Token Carving
要約 ビデオ拡散トランス(DIT)モデルの顕著な生成品質にもかかわらず、それらの … 続きを読む
カテゴリー: cs.CV
Training-Free Efficient Video Generation via Dynamic Token Carving はコメントを受け付けていません
T2I-ConBench: Text-to-Image Benchmark for Continual Post-training
要約 継続的なトレーニング後のテキストから画像間拡散モデルを適応させて、個別のモ … 続きを読む
Tracking the Flight: Exploring a Computational Framework for Analyzing Escape Responses in Plains Zebra (Equus quagga)
要約 エステル研究は、ドローンの手頃な価格とアクセシビリティの高まりによりますま … 続きを読む
カテゴリー: cs.CV
Tracking the Flight: Exploring a Computational Framework for Analyzing Escape Responses in Plains Zebra (Equus quagga) はコメントを受け付けていません
MindGYM: What Matters in Question Synthesis for Thinking-Centric Fine-Tuning?
要約 大規模なファンデーションモデルは、特に剛性テンプレートまたは群衆発表の命令 … 続きを読む