cs.CV」カテゴリーアーカイブ

Knowledge Circuits in Pretrained Transformers

要約 現代の大規模言語モデルの卓越した能力は、そのパラメータにエンコードされた膨 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR, cs.LG | Knowledge Circuits in Pretrained Transformers はコメントを受け付けていません

Agent Planning with World Knowledge Model

要約 大規模言語モデル(LLM)をエージェントモデルとして直接利用し、対話的な計 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MA | Agent Planning with World Knowledge Model はコメントを受け付けていません

EnerVerse: Envisioning Embodied Future Space for Robotics Manipulation

要約 我々は、ロボット操作タスクのために特別に設計された、具現化された未来空間生 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | EnerVerse: Envisioning Embodied Future Space for Robotics Manipulation はコメントを受け付けていません

Virgo: A Preliminary Exploration on Reproducing o1-like MLLM

要約 近年、大規模言語モデル(LLM)を用いたゆっくり考える推論システムが、推論 … 続きを読む

カテゴリー: cs.AI, cs.CV | Virgo: A Preliminary Exploration on Reproducing o1-like MLLM はコメントを受け付けていません

Detecting and Mitigating Adversarial Attacks on Deep Learning-Based MRI Reconstruction Without Any Retraining

要約 ディープラーニング(DL)手法、特に物理駆動型DLに基づく手法は、サブサン … 続きを読む

カテゴリー: cs.CV, cs.LG | Detecting and Mitigating Adversarial Attacks on Deep Learning-Based MRI Reconstruction Without Any Retraining はコメントを受け付けていません

Conditional Consistency Guided Image Translation and Enhancement

要約 一貫性モデルは、拡散モデルに代わる有望なモデルとして登場し、シングルステッ … 続きを読む

カテゴリー: cs.CV, cs.LG | Conditional Consistency Guided Image Translation and Enhancement はコメントを受け付けていません

Exoplanet Detection via Differentiable Rendering

要約 太陽系外惑星の直接撮像は、太陽系外の惑星系の理解を進める上で極めて重要であ … 続きを読む

カテゴリー: astro-ph.EP, astro-ph.IM, cs.CV, eess.IV | Exoplanet Detection via Differentiable Rendering はコメントを受け付けていません

DINO-LG: A Task-Specific DINO Model for Coronary Calcium Scoring

要約 冠動脈疾患(CAD)は、世界的な死亡率の主要原因の1つであり、効果的なリス … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | DINO-LG: A Task-Specific DINO Model for Coronary Calcium Scoring はコメントを受け付けていません

Transformer-Driven Inverse Problem Transform for Fast Blind Hyperspectral Image Dehazing

要約 ハイパースペクトルデハイズ(HyDHZ)は、その後の同定や分類作業を容易に … 続きを読む

カテゴリー: cs.CV, eess.IV | Transformer-Driven Inverse Problem Transform for Fast Blind Hyperspectral Image Dehazing はコメントを受け付けていません

Mitigating Hallucination for Large Vision Language Model by Inter-Modality Correlation Calibration Decoding

要約 大規模視覚言語モデル(LVLM)は、下流のマルチモーダルタスクの視覚言語理 … 続きを読む

カテゴリー: cs.AI, cs.CV | Mitigating Hallucination for Large Vision Language Model by Inter-Modality Correlation Calibration Decoding はコメントを受け付けていません