投稿者「jarxiv」のアーカイブ

Radiant Triangle Soup with Soft Connectivity Forces for 3D Reconstruction and Novel View Synthesis

要約 この作業では、シーンのジオメトリと外観を表すために三角形を使用した推論時間 … 続きを読む

カテゴリー: cs.CV | Radiant Triangle Soup with Soft Connectivity Forces for 3D Reconstruction and Novel View Synthesis はコメントを受け付けていません

Merge-Friendly Post-Training Quantization for Multi-Target Domain Adaptation

要約 モデルのマージは、タスク固有の重みを組み合わせて、マルチターゲットドメイン … 続きを読む

カテゴリー: cs.CV, cs.LG | Merge-Friendly Post-Training Quantization for Multi-Target Domain Adaptation はコメントを受け付けていません

VideoREPA: Learning Physics for Video Generation through Relational Alignment with Foundation Models

要約 テキストからビデオへの最近の進歩(T2V)拡散モデルにより、忠実で現実的な … 続きを読む

カテゴリー: cs.CV | VideoREPA: Learning Physics for Video Generation through Relational Alignment with Foundation Models はコメントを受け付けていません

D-AR: Diffusion via Autoregressive Models

要約 このホワイトペーパーでは、標準の次のトークン予測のファッションでのバニラの … 続きを読む

カテゴリー: cs.CV | D-AR: Diffusion via Autoregressive Models はコメントを受け付けていません

OpenUni: A Simple Baseline for Unified Multimodal Understanding and Generation

要約 このレポートでは、マルチモーダルの理解と生成を統合するためのシンプルで軽量 … 続きを読む

カテゴリー: cs.CV | OpenUni: A Simple Baseline for Unified Multimodal Understanding and Generation はコメントを受け付けていません

SIGHT: Synthesizing Image-Text Conditioned and Geometry-Guided 3D Hand-Object Trajectories

要約 人間がオブジェクトを把握するとき、彼らは自然に心の中で軌跡を形成して、特定 … 続きを読む

カテゴリー: cs.CV | SIGHT: Synthesizing Image-Text Conditioned and Geometry-Guided 3D Hand-Object Trajectories はコメントを受け付けていません

ImmunoDiff: A Diffusion Model for Immunotherapy Response Prediction in Lung Cancer

要約 非小細胞肺癌(NSCLC)における免疫療法反応を正確に予測することは、依然 … 続きを読む

カテゴリー: cs.CV | ImmunoDiff: A Diffusion Model for Immunotherapy Response Prediction in Lung Cancer はコメントを受け付けていません

Grounded Reinforcement Learning for Visual Reasoning

要約 思考チェーンを介した強化学習(RL)は、数学やコーディングなどのタスクで大 … 続きを読む

カテゴリー: cs.CV | Grounded Reinforcement Learning for Visual Reasoning はコメントを受け付けていません

CVOCSemRPL: Class-Variance Optimized Clustering, Semantic Information Injection and Restricted Pseudo Labeling based Improved Semi-Supervised Few-Shot Learning

要約 いくつかのショット学習は、一部のクラスでラベル付けされたサンプルの量が非常 … 続きを読む

カテゴリー: cs.CV | CVOCSemRPL: Class-Variance Optimized Clustering, Semantic Information Injection and Restricted Pseudo Labeling based Improved Semi-Supervised Few-Shot Learning はコメントを受け付けていません

BrainMRDiff: A Diffusion Model for Anatomically Consistent Brain MRI Synthesis

要約 正確な脳腫瘍診断は、複数の磁気共鳴画像(MRI)配列の評価に依存しています … 続きを読む

カテゴリー: cs.CV, eess.IV | BrainMRDiff: A Diffusion Model for Anatomically Consistent Brain MRI Synthesis はコメントを受け付けていません