投稿者「jarxiv」のアーカイブ

VideoLLaMA 3: Frontier Multimodal Foundation Models for Image and Video Understanding

投稿日: 2025年1月24日作成者: jarxiv

要約この論文では、画像とビデオを理解するためのより高度なマルチモーダル基盤モデ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Accelerate High-Quality Diffusion Models with Inner Loop Feedback

投稿日: 2025年1月24日作成者: jarxiv

要約拡散モデルの推論を加速するための新しいアプローチであるインナーループフィー … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Reasoning Language Models: A Blueprint

投稿日: 2025年1月24日作成者: jarxiv

要約 OpenaiのO1およびO3、DeepSeek-V3、AlibabaのQW … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

CHaRNet: Conditioned Heatmap Regression for Robust Dental Landmark Localization

投稿日: 2025年1月24日作成者: jarxiv

要約 3D歯科モデルでの解剖学的ランドマークを特定することは、歯科矯正治療に不可 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Design Optimizer for Soft Growing Robot Manipulators in Three-Dimensional Environments

投稿日: 2025年1月24日作成者: jarxiv

要約柔らかい成長ロボットは、雑然とした環境や危険な環境でのナビゲーションのため … 続きを読む →

カテゴリー: cs.AI, cs.NE, cs.RO | コメントを受け付けていません

Med-R$^2$: Crafting Trustworthy LLM Physicians through Retrieval and Reasoning of Evidence-Based Medicine

投稿日: 2025年1月24日作成者: jarxiv

要約近年、大規模な言語モデル（LLM）は、臨床シナリオで顕著な能力を示していま … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

AdaWM: Adaptive World Model based Planning for Autonomous Driving

投稿日: 2025年1月24日作成者: jarxiv

要約ワールドモデルベースの強化学習 (RL) は、潜在的なダイナミクスモ … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

SpatialCoT: Advancing Spatial Reasoning through Coordinate Alignment and Chain-of-Thought for Embodied Task Planning

投稿日: 2025年1月24日作成者: jarxiv

要約空間的推論は、具体化されたAI研究において重要な問題です。補足的な空間デ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Boosting Diffusion Guidance via Learning Degradation-Aware Models for Blind Super Resolution

投稿日: 2025年1月24日作成者: jarxiv

要約最近、拡散ベースのブラインドスーパー解像度（SR）メソッドは、豊富な高周波 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Cross-D Conv: Cross-Dimensional Transferable Knowledge Base via Fourier Shifting Operation

投稿日: 2025年1月24日作成者: jarxiv

要約生物医学画像解析では、2D データと 3D データの間の二項対立が大きな課 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

VideoLLaMA 3: Frontier Multimodal Foundation Models for Image and Video Understanding

Accelerate High-Quality Diffusion Models with Inner Loop Feedback

Reasoning Language Models: A Blueprint

CHaRNet: Conditioned Heatmap Regression for Robust Dental Landmark Localization

Design Optimizer for Soft Growing Robot Manipulators in Three-Dimensional Environments

Med-R$^2$: Crafting Trustworthy LLM Physicians through Retrieval and Reasoning of Evidence-Based Medicine

AdaWM: Adaptive World Model based Planning for Autonomous Driving

SpatialCoT: Advancing Spatial Reasoning through Coordinate Alignment and Chain-of-Thought for Embodied Task Planning

Boosting Diffusion Guidance via Learning Degradation-Aware Models for Blind Super Resolution

Cross-D Conv: Cross-Dimensional Transferable Knowledge Base via Fourier Shifting Operation

最近の投稿

最近のコメント

アーカイブ

カテゴリー