cs.AI」カテゴリーアーカイブ

Composite Sketch+Text Queries for Retrieving Objects with Elusive Names and Complex Interactions

要約 限られた語彙を持つ非ネイティブスピーカーは、それらを視覚化することができた … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR, cs.MM | Composite Sketch+Text Queries for Retrieving Objects with Elusive Names and Complex Interactions はコメントを受け付けていません

mmE5: Improving Multimodal Multilingual Embeddings via High-quality Synthetic Data

要約 マルチモーダル埋め込みモデルは、テキストや画像などのさまざまなモダリティか … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | mmE5: Improving Multimodal Multilingual Embeddings via High-quality Synthetic Data はコメントを受け付けていません

Surface Vision Mamba: Leveraging Bidirectional State Space Model for Efficient Spherical Manifold Representation

要約 注意ベースの方法は、従来の幾何学的深部学習(GDL)モデルを上回り、球状の … 続きを読む

カテゴリー: cs.AI, cs.CV | Surface Vision Mamba: Leveraging Bidirectional State Space Model for Efficient Spherical Manifold Representation はコメントを受け付けていません

Human-Centric Foundation Models: Perception, Generation and Agentic Modeling

要約 人間の理解と生成は、デジタル人間とヒューマノイドの実施形態をモデル化するた … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | Human-Centric Foundation Models: Perception, Generation and Agentic Modeling はコメントを受け付けていません

TimeSuite: Improving MLLMs for Long Video Understanding via Grounded Tuning

要約 マルチモーダル大手言語モデル(MLLMS)は、短いビデオ理解で印象的なパフ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | TimeSuite: Improving MLLMs for Long Video Understanding via Grounded Tuning はコメントを受け付けていません

Brain Latent Progression: Individual-based Spatiotemporal Disease Progression on 3D Brain MRIs via Latent Diffusion

要約 縦方向の磁気共鳴イメージング(MRI)データセットの利用可能性の増加により … 続きを読む

カテゴリー: cs.AI, cs.CV | Brain Latent Progression: Individual-based Spatiotemporal Disease Progression on 3D Brain MRIs via Latent Diffusion はコメントを受け付けていません

A Novel Approach to for Multimodal Emotion Recognition : Multimodal semantic information fusion

要約 人工知能とコンピュータービジョンテクノロジーの進歩により、マルチモーダル感 … 続きを読む

カテゴリー: cs.AI, cs.CV | A Novel Approach to for Multimodal Emotion Recognition : Multimodal semantic information fusion はコメントを受け付けていません

Randomness of Low-Layer Parameters Determines Confusing Samples in Terms of Interaction Representations of a DNN

要約 この論文では、ディープニューラルネットワーク(DNN)によってエンコードさ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Randomness of Low-Layer Parameters Determines Confusing Samples in Terms of Interaction Representations of a DNN はコメントを受け付けていません

Utility Engineering: Analyzing and Controlling Emergent Value Systems in AIs

要約 AISが急速に前進し、よりエージェントになるにつれて、彼らが提起するリスク … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.CY, cs.LG | Utility Engineering: Analyzing and Controlling Emergent Value Systems in AIs はコメントを受け付けていません

A Real-to-Sim-to-Real Approach to Robotic Manipulation with VLM-Generated Iterative Keypoint Rewards

要約 オープンワールド環境でのロボット操作のタスク仕様は挑戦的であり、人間の意図 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | A Real-to-Sim-to-Real Approach to Robotic Manipulation with VLM-Generated Iterative Keypoint Rewards はコメントを受け付けていません