-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
VINGS-Mono: Visual-Inertial Gaussian Splatting Monocular SLAM in Large Scenes
要約 VINGS-Mono は、大規模なシーン向けに設計された単眼 (慣性) ガ … 続きを読む
A Multi-Modal Approach for Face Anti-Spoofing in Non-Calibrated Systems using Disparity Maps
要約 顔認識技術はさまざまなアプリケーションでますます使用されていますが、顔のな … 続きを読む
Gaussian Eigen Models for Human Heads
要約 現在のパーソナライズされたニューラル ヘッド アバターはトレードオフに直面 … 続きを読む
カテゴリー: cs.CV
Gaussian Eigen Models for Human Heads はコメントを受け付けていません
LayerAnimate: Layer-specific Control for Animation
要約 アニメーション ビデオでは、前景要素と背景要素がレイヤーに分離され、スケッ … 続きを読む
カテゴリー: cs.CV
LayerAnimate: Layer-specific Control for Animation はコメントを受け付けていません
Advancing Semantic Future Prediction through Multimodal Visual Sequence Transformers
要約 意味論的な将来予測は、動的環境をナビゲートする自律システムにとって重要です … 続きを読む
カテゴリー: cs.CV
Advancing Semantic Future Prediction through Multimodal Visual Sequence Transformers はコメントを受け付けていません
MiniMax-01: Scaling Foundation Models with Lightning Attention
要約 MiniMax-Text-01 および MiniMax-VL-01 を含む … 続きを読む
Rate-In: Information-Driven Adaptive Dropout Rates for Improved Inference-Time Uncertainty Estimation
要約 医療診断などのリスクに敏感なアプリケーションにニューラル ネットワークを導 … 続きを読む
Diffusion Adversarial Post-Training for One-Step Video Generation
要約 拡散モデルは画像やビデオの生成に広く使用されていますが、反復生成プロセスは … 続きを読む
GameFactory: Creating New Games with Generative Interactive Videos
要約 生成型ゲーム エンジンは、新しいコンテンツを自律的に作成し、手動の作業負荷 … 続きを読む
カテゴリー: cs.CV
GameFactory: Creating New Games with Generative Interactive Videos はコメントを受け付けていません
Omni-RGPT: Unifying Image and Video Region-level Understanding via Token Marks
要約 私たちは、画像とビデオの両方の領域レベルの理解を容易にするように設計された … 続きを読む
カテゴリー: cs.CV
Omni-RGPT: Unifying Image and Video Region-level Understanding via Token Marks はコメントを受け付けていません