cs.AI」カテゴリーアーカイブ

PhyT2V: LLM-Guided Iterative Self-Refinement for Physics-Grounded Text-to-Video Generation

要約 テキスト間(T2V)の生成は、変圧器ベースの拡散モデルによって最近有効にな … 続きを読む

カテゴリー: cs.AI, cs.CV | PhyT2V: LLM-Guided Iterative Self-Refinement for Physics-Grounded Text-to-Video Generation はコメントを受け付けていません

Exploiting Mixture-of-Experts Redundancy Unlocks Multimodal Generative Abilities

要約 この作業では、2つのコア制約を満たしながら、マルチモーダル生成機能を備えた … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Exploiting Mixture-of-Experts Redundancy Unlocks Multimodal Generative Abilities はコメントを受け付けていません

Nonhuman Primate Brain Tissue Segmentation Using a Transfer Learning Approach

要約 非ヒト霊長類(NHP)は、人間との密接な進化的関係により、人間の脳機能と神 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | Nonhuman Primate Brain Tissue Segmentation Using a Transfer Learning Approach はコメントを受け付けていません

Att-Adapter: A Robust and Precise Domain-Specific Multi-Attributes T2I Diffusion Adapter via Conditional Variational Autoencoder

要約 テキストからイメージ(T2I)拡散モデルは、高品質の画像を生成する際に顕著 … 続きを読む

カテゴリー: cs.AI, cs.CV | Att-Adapter: A Robust and Precise Domain-Specific Multi-Attributes T2I Diffusion Adapter via Conditional Variational Autoencoder はコメントを受け付けていません

Enhanced Controllability of Diffusion Models via Feature Disentanglement and Realism-Enhanced Sampling Methods

要約 拡散モデルが有望なパフォーマンスを示しているため、拡散モデルの制御可能性を … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | Enhanced Controllability of Diffusion Models via Feature Disentanglement and Realism-Enhanced Sampling Methods はコメントを受け付けていません

NTSEBENCH: Cognitive Reasoning Benchmark for Vision Language Models

要約 パズル、シリーズ、アナロジーを含む認知的テキストおよび視覚的推論タスクは、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR | NTSEBENCH: Cognitive Reasoning Benchmark for Vision Language Models はコメントを受け付けていません

Evaluating machine learning models for predicting pesticides toxicity to honey bees

要約 小分子は、生物医学、環境、および農薬のドメインで重要な役割を果たし、それぞ … 続きを読む

カテゴリー: cs.AI, cs.LG | Evaluating machine learning models for predicting pesticides toxicity to honey bees はコメントを受け付けていません

Visual Acoustic Fields

要約 オブジェクトはヒットすると異なる音を生成し、人間はその外観と材料特性に基づ … 続きを読む

カテゴリー: cs.AI, cs.CV | Visual Acoustic Fields はコメントを受け付けていません

Handling Delay in Real-Time Reinforcement Learning

要約 リアルタイム強化学習(RL)は、いくつかの課題を導入します。 まず、ポリシ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Handling Delay in Real-Time Reinforcement Learning はコメントを受け付けていません

Boosting Omnidirectional Stereo Matching with a Pre-trained Depth Foundation Model

要約 完全な360 {\ deg}の視野でシーンの理解を必要とするモバイルロボッ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Boosting Omnidirectional Stereo Matching with a Pre-trained Depth Foundation Model はコメントを受け付けていません