月別アーカイブ: 2025年2月

Sketched Equivariant Imaging Regularization and Deep Internal Learning for Inverse Problems

要約 Equivariant Imaging(EI)の正則化は、地上の真実データ … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, math.OC | Sketched Equivariant Imaging Regularization and Deep Internal Learning for Inverse Problems はコメントを受け付けていません

Deep Spatiotemporal Clutter Filtering of Transthoracic Echocardiographic Images: Leveraging Contextual Attention and Residual Learning

要約 この研究では、経胸壁心エコー(TTE)画像シーケンスから残響乱雑さをフィル … 続きを読む

カテゴリー: cs.CV, eess.IV | Deep Spatiotemporal Clutter Filtering of Transthoracic Echocardiographic Images: Leveraging Contextual Attention and Residual Learning はコメントを受け付けていません

Randomness of Low-Layer Parameters Determines Confusing Samples in Terms of Interaction Representations of a DNN

要約 この論文では、ディープニューラルネットワーク(DNN)によってエンコードさ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Randomness of Low-Layer Parameters Determines Confusing Samples in Terms of Interaction Representations of a DNN はコメントを受け付けていません

Ola: Pushing the Frontiers of Omni-Modal Language Model with Progressive Modality Alignment

要約 特にGPT-4Oに続く大規模な言語モデルの最近の進歩により、より多くのモダ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM, cs.SD, eess.AS, eess.IV | Ola: Pushing the Frontiers of Omni-Modal Language Model with Progressive Modality Alignment はコメントを受け付けていません

Rapid Whole Brain Mesoscale In-vivo MR Imaging using Multi-scale Implicit Neural Representation

要約 目的:スキャン時間を削減しながら高信号対雑音比(SNR)を維持しながら、マ … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Rapid Whole Brain Mesoscale In-vivo MR Imaging using Multi-scale Implicit Neural Representation はコメントを受け付けていません

PulseCheck457: A Diagnostic Benchmark for Comprehensive Spatial Reasoning of Large Multimodal Models

要約 大規模なマルチモーダルモデル(LMM)は、視覚的なシーンの解釈と推論におい … 続きを読む

カテゴリー: cs.CV | PulseCheck457: A Diagnostic Benchmark for Comprehensive Spatial Reasoning of Large Multimodal Models はコメントを受け付けていません

CineMaster: A 3D-Aware and Controllable Framework for Cinematic Text-to-Video Generation

要約 この作業では、3Dが認識し、制御可能なテキストからビデオへの生成のための新 … 続きを読む

カテゴリー: cs.CV | CineMaster: A 3D-Aware and Controllable Framework for Cinematic Text-to-Video Generation はコメントを受け付けていません

Utility Engineering: Analyzing and Controlling Emergent Value Systems in AIs

要約 AISが急速に前進し、よりエージェントになるにつれて、彼らが提起するリスク … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.CY, cs.LG | Utility Engineering: Analyzing and Controlling Emergent Value Systems in AIs はコメントを受け付けていません

SwiftSketch: A Diffusion Model for Image-to-Vector Sketch Generation

要約 大規模なビジョン言語モデルの最近の進歩により、非常に表現力豊かで多様なベク … 続きを読む

カテゴリー: cs.CV | SwiftSketch: A Diffusion Model for Image-to-Vector Sketch Generation はコメントを受け付けていません

A Real-to-Sim-to-Real Approach to Robotic Manipulation with VLM-Generated Iterative Keypoint Rewards

要約 オープンワールド環境でのロボット操作のタスク仕様は挑戦的であり、人間の意図 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | A Real-to-Sim-to-Real Approach to Robotic Manipulation with VLM-Generated Iterative Keypoint Rewards はコメントを受け付けていません