投稿者「jarxiv」のアーカイブ

VideoLLaMA 3: Frontier Multimodal Foundation Models for Image and Video Understanding

要約 この論文では、画像とビデオを理解するためのより高度なマルチモーダル基盤モデ … 続きを読む

カテゴリー: cs.CV | VideoLLaMA 3: Frontier Multimodal Foundation Models for Image and Video Understanding はコメントを受け付けていません

Accelerate High-Quality Diffusion Models with Inner Loop Feedback

要約 拡散モデルの推論を加速するための新しいアプローチであるインナーループフィー … 続きを読む

カテゴリー: cs.CV | Accelerate High-Quality Diffusion Models with Inner Loop Feedback はコメントを受け付けていません

Reasoning Language Models: A Blueprint

要約 OpenaiのO1およびO3、DeepSeek-V3、AlibabaのQW … 続きを読む

カテゴリー: cs.AI, cs.CL | Reasoning Language Models: A Blueprint はコメントを受け付けていません

CHaRNet: Conditioned Heatmap Regression for Robust Dental Landmark Localization

要約 3D歯科モデルでの解剖学的ランドマークを特定することは、歯科矯正治療に不可 … 続きを読む

カテゴリー: cs.CV | CHaRNet: Conditioned Heatmap Regression for Robust Dental Landmark Localization はコメントを受け付けていません

Design Optimizer for Soft Growing Robot Manipulators in Three-Dimensional Environments

要約 柔らかい成長ロボットは、雑然とした環境や危険な環境でのナビゲーションのため … 続きを読む

カテゴリー: cs.AI, cs.NE, cs.RO | Design Optimizer for Soft Growing Robot Manipulators in Three-Dimensional Environments はコメントを受け付けていません

Med-R$^2$: Crafting Trustworthy LLM Physicians through Retrieval and Reasoning of Evidence-Based Medicine

要約 近年、大規模な言語モデル(LLM)は、臨床シナリオで顕著な能力を示していま … 続きを読む

カテゴリー: cs.CL | Med-R$^2$: Crafting Trustworthy LLM Physicians through Retrieval and Reasoning of Evidence-Based Medicine はコメントを受け付けていません

AdaWM: Adaptive World Model based Planning for Autonomous Driving

要約 ワールド モデル ベースの強化学習 (RL) は、潜在的なダイナミクス モ … 続きを読む

カテゴリー: cs.AI, cs.RO | AdaWM: Adaptive World Model based Planning for Autonomous Driving はコメントを受け付けていません

SpatialCoT: Advancing Spatial Reasoning through Coordinate Alignment and Chain-of-Thought for Embodied Task Planning

要約 空間的推論は、具体化されたAI研究において重要な問題です。 補足的な空間デ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | SpatialCoT: Advancing Spatial Reasoning through Coordinate Alignment and Chain-of-Thought for Embodied Task Planning はコメントを受け付けていません

Boosting Diffusion Guidance via Learning Degradation-Aware Models for Blind Super Resolution

要約 最近、拡散ベースのブラインドスーパー解像度(SR)メソッドは、豊富な高周波 … 続きを読む

カテゴリー: cs.CV, eess.IV | Boosting Diffusion Guidance via Learning Degradation-Aware Models for Blind Super Resolution はコメントを受け付けていません

Cross-D Conv: Cross-Dimensional Transferable Knowledge Base via Fourier Shifting Operation

要約 生物医学画像解析では、2D データと 3D データの間の二項対立が大きな課 … 続きを読む

カテゴリー: cs.CV | Cross-D Conv: Cross-Dimensional Transferable Knowledge Base via Fourier Shifting Operation はコメントを受け付けていません