-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Sketched Equivariant Imaging Regularization and Deep Internal Learning for Inverse Problems
要約 Equivariant Imaging(EI)の正則化は、地上の真実データ … 続きを読む
Deep Spatiotemporal Clutter Filtering of Transthoracic Echocardiographic Images: Leveraging Contextual Attention and Residual Learning
要約 この研究では、経胸壁心エコー(TTE)画像シーケンスから残響乱雑さをフィル … 続きを読む
Randomness of Low-Layer Parameters Determines Confusing Samples in Terms of Interaction Representations of a DNN
要約 この論文では、ディープニューラルネットワーク(DNN)によってエンコードさ … 続きを読む
Ola: Pushing the Frontiers of Omni-Modal Language Model with Progressive Modality Alignment
要約 特にGPT-4Oに続く大規模な言語モデルの最近の進歩により、より多くのモダ … 続きを読む
Rapid Whole Brain Mesoscale In-vivo MR Imaging using Multi-scale Implicit Neural Representation
要約 目的:スキャン時間を削減しながら高信号対雑音比(SNR)を維持しながら、マ … 続きを読む
PulseCheck457: A Diagnostic Benchmark for Comprehensive Spatial Reasoning of Large Multimodal Models
要約 大規模なマルチモーダルモデル(LMM)は、視覚的なシーンの解釈と推論におい … 続きを読む
カテゴリー: cs.CV
PulseCheck457: A Diagnostic Benchmark for Comprehensive Spatial Reasoning of Large Multimodal Models はコメントを受け付けていません
CineMaster: A 3D-Aware and Controllable Framework for Cinematic Text-to-Video Generation
要約 この作業では、3Dが認識し、制御可能なテキストからビデオへの生成のための新 … 続きを読む
カテゴリー: cs.CV
CineMaster: A 3D-Aware and Controllable Framework for Cinematic Text-to-Video Generation はコメントを受け付けていません
Utility Engineering: Analyzing and Controlling Emergent Value Systems in AIs
要約 AISが急速に前進し、よりエージェントになるにつれて、彼らが提起するリスク … 続きを読む
SwiftSketch: A Diffusion Model for Image-to-Vector Sketch Generation
要約 大規模なビジョン言語モデルの最近の進歩により、非常に表現力豊かで多様なベク … 続きを読む
カテゴリー: cs.CV
SwiftSketch: A Diffusion Model for Image-to-Vector Sketch Generation はコメントを受け付けていません
A Real-to-Sim-to-Real Approach to Robotic Manipulation with VLM-Generated Iterative Keypoint Rewards
要約 オープンワールド環境でのロボット操作のタスク仕様は挑戦的であり、人間の意図 … 続きを読む