-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年2月
Sketched Equivariant Imaging Regularization and Deep Internal Learning for Inverse Problems
要約 Equivariant Imaging(EI)の正則化は、地上の真実データ … 続きを読む
Deep Spatiotemporal Clutter Filtering of Transthoracic Echocardiographic Images: Leveraging Contextual Attention and Residual Learning
要約 この研究では、経胸壁心エコー(TTE)画像シーケンスから残響乱雑さをフィル … 続きを読む
Randomness of Low-Layer Parameters Determines Confusing Samples in Terms of Interaction Representations of a DNN
要約 この論文では、ディープニューラルネットワーク(DNN)によってエンコードさ … 続きを読む
Ola: Pushing the Frontiers of Omni-Modal Language Model with Progressive Modality Alignment
要約 特にGPT-4Oに続く大規模な言語モデルの最近の進歩により、より多くのモダ … 続きを読む
Rapid Whole Brain Mesoscale In-vivo MR Imaging using Multi-scale Implicit Neural Representation
要約 目的:スキャン時間を削減しながら高信号対雑音比(SNR)を維持しながら、マ … 続きを読む
PulseCheck457: A Diagnostic Benchmark for Comprehensive Spatial Reasoning of Large Multimodal Models
要約 大規模なマルチモーダルモデル(LMM)は、視覚的なシーンの解釈と推論におい … 続きを読む
カテゴリー: cs.CV
PulseCheck457: A Diagnostic Benchmark for Comprehensive Spatial Reasoning of Large Multimodal Models はコメントを受け付けていません
CineMaster: A 3D-Aware and Controllable Framework for Cinematic Text-to-Video Generation
要約 この作業では、3Dが認識し、制御可能なテキストからビデオへの生成のための新 … 続きを読む
カテゴリー: cs.CV
CineMaster: A 3D-Aware and Controllable Framework for Cinematic Text-to-Video Generation はコメントを受け付けていません
Utility Engineering: Analyzing and Controlling Emergent Value Systems in AIs
要約 AISが急速に前進し、よりエージェントになるにつれて、彼らが提起するリスク … 続きを読む
SwiftSketch: A Diffusion Model for Image-to-Vector Sketch Generation
要約 大規模なビジョン言語モデルの最近の進歩により、非常に表現力豊かで多様なベク … 続きを読む
カテゴリー: cs.CV
SwiftSketch: A Diffusion Model for Image-to-Vector Sketch Generation はコメントを受け付けていません
A Real-to-Sim-to-Real Approach to Robotic Manipulation with VLM-Generated Iterative Keypoint Rewards
要約 オープンワールド環境でのロボット操作のタスク仕様は挑戦的であり、人間の意図 … 続きを読む