cs.AI」カテゴリーアーカイブ

RILe: Reinforced Imitation Learning

要約 強化学習は、複雑な動作を生成することに大きな成功を収めていますが、多くの場 … 続きを読む

カテゴリー: cs.AI, cs.LG | RILe: Reinforced Imitation Learning はコメントを受け付けていません

Diffusion Model with Cross Attention as an Inductive Bias for Disentanglement

要約 解きほぐされた表現学習は、観察されたデータ内の固有の要素を抽出することを目 … 続きを読む

カテゴリー: cs.AI, cs.CV | Diffusion Model with Cross Attention as an Inductive Bias for Disentanglement はコメントを受け付けていません

DocSynthv2: A Practical Autoregressive Modeling for Document Generation

要約 ドキュメント レイアウトの生成は広く研究されていますが、レイアウトとコンテ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | DocSynthv2: A Practical Autoregressive Modeling for Document Generation はコメントを受け付けていません

From a Social Cognitive Perspective: Context-aware Visual Social Relationship Recognition

要約 人々の社会的関係は、結婚指輪、バラ、ハグ、手をつなぐなど、特定の物体や相互 … 続きを読む

カテゴリー: cs.AI, cs.CV | From a Social Cognitive Perspective: Context-aware Visual Social Relationship Recognition はコメントを受け付けていません

2.5D Multi-view Averaging Diffusion Model for 3D Medical Image Translation: Application to Low-count PET Reconstruction with CT-less Attenuation Correction

要約 陽電子放出断層撮影法 (PET) は重要な臨床画像ツールですが、患者や医療 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | 2.5D Multi-view Averaging Diffusion Model for 3D Medical Image Translation: Application to Low-count PET Reconstruction with CT-less Attenuation Correction はコメントを受け付けていません

MMWorld: Towards Multi-discipline Multi-faceted World Model Evaluation in Videos

要約 マルチモーダル言語言語モデル (MLLM) は、「ワールド モデル」、つま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | MMWorld: Towards Multi-discipline Multi-faceted World Model Evaluation in Videos はコメントを受け付けていません

OmniCorpus: An Unified Multimodal Corpus of 10 Billion-Level Images Interleaved with Text

要約 画像とテキストが交互に配置されたデータは、自然な文書形式に配置された複数の … 続きを読む

カテゴリー: cs.AI, cs.CV | OmniCorpus: An Unified Multimodal Corpus of 10 Billion-Level Images Interleaved with Text はコメントを受け付けていません

AWGUNET: Attention-Aided Wavelet Guided U-Net for Nuclei Segmentation in Histopathology Images

要約 病理組織画像における核の正確なセグメンテーションは、がんの診断にとって非常 … 続きを読む

カテゴリー: cs.AI, cs.CV | AWGUNET: Attention-Aided Wavelet Guided U-Net for Nuclei Segmentation in Histopathology Images はコメントを受け付けていません

Diffusion Soup: Model Merging for Text-to-Image Diffusion Models

要約 シャーディングされたデータでトレーニングされた拡散モデルの重みを平均する、 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV, cs.LG | Diffusion Soup: Model Merging for Text-to-Image Diffusion Models はコメントを受け付けていません

Real2Code: Reconstruct Articulated Objects via Code Generation

要約 コード生成を通じて多関節オブジェクトを再構築する新しいアプローチである R … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Real2Code: Reconstruct Articulated Objects via Code Generation はコメントを受け付けていません