-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Boosting Camera Motion Control for Video Diffusion Transformers
要約 拡散モデルの最近の進歩により、ビデオ生成の品質が大幅に向上しました。 ただ … 続きを読む
HART: Efficient Visual Generation with Hybrid Autoregressive Transformer
要約 画像生成品質において拡散モデルに匹敵する、1024×1024 画 … 続きを読む
Depth Any Video with Scalable Synthetic Data
要約 ビデオ深度の推定は、一貫性とスケーラブルなグラウンド トゥルース データの … 続きを読む
LVD-2M: A Long-take Video Dataset with Temporally Dense Captions
要約 ビデオ生成モデルの有効性は、トレーニング データセットの品質に大きく依存し … 続きを読む
TemporalBench: Benchmarking Fine-grained Temporal Understanding for Multimodal Video Models
要約 マルチモーダルビデオの理解と生成には、きめの細かい時間ダイナミクスを理解す … 続きを読む
AgentHarm: A Benchmark for Measuring Harmfulness of LLM Agents
要約 ユーザーが安全対策を回避しモデル機能を悪用するプロンプトを設計する脱獄攻撃 … 続きを読む
SimpleStrat: Diversifying Language Model Generation with Stratification
要約 大規模言語モデル (LLM) から多様な応答を生成することは、多様性によっ … 続きを読む
DCNet: A Data-Driven Framework for DVL Calibration
要約 自律型水中ビークル (AUV) は、さまざまな用途に使用される水中ロボット … 続きを読む
Learning Representations of Instruments for Partial Identification of Treatment Effects
要約 観察データから治療効果を信頼性高く推定することは、医学などの多くの分野にお … 続きを読む