cs.AI」カテゴリーアーカイブ

Video Latent Flow Matching: Optimal Polynomial Projections for Video Interpolation and Extrapolation

要約 本論文では、Video Latent Flow Matching (VLF … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Video Latent Flow Matching: Optimal Polynomial Projections for Video Interpolation and Extrapolation はコメントを受け付けていません

LV-XAttn: Distributed Cross-Attention for Long Visual Inputs in Multimodal Large Language Models

要約 クロスアテンションは、視覚情報を言語バックボーンに統合するために、マルチモ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.DC, cs.LG | LV-XAttn: Distributed Cross-Attention for Long Visual Inputs in Multimodal Large Language Models はコメントを受け付けていません

Mind the Gap: Evaluating Patch Embeddings from General-Purpose and Histopathology Foundation Models for Cell Segmentation and Classification

要約 最近の基礎モデルの進歩はコンピュータ・ビジョンに変革をもたらし、デジタル病 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, q-bio.QM | Mind the Gap: Evaluating Patch Embeddings from General-Purpose and Histopathology Foundation Models for Cell Segmentation and Classification はコメントを受け付けていません

A Self-Supervised Framework for Improved Generalisability in Ultrasound B-mode Image Segmentation

要約 超音波(US)画像診断は、その非侵襲的で安全な性質から、臨床的に非常に貴重 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | A Self-Supervised Framework for Improved Generalisability in Ultrasound B-mode Image Segmentation はコメントを受け付けていません

Unified Spatial-Temporal Edge-Enhanced Graph Networks for Pedestrian Trajectory Prediction

要約 歩行者の軌跡予測は、過去の経路に基づいて将来の動きを予測することを目的とし … 続きを読む

カテゴリー: cs.AI, cs.CV | Unified Spatial-Temporal Edge-Enhanced Graph Networks for Pedestrian Trajectory Prediction はコメントを受け付けていません

ChartMoE: Mixture of Expert Connector for Advanced Chart Understanding

要約 図表の自動理解は、内容理解や文書構文解析にとって極めて重要である。マルチモ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | ChartMoE: Mixture of Expert Connector for Advanced Chart Understanding はコメントを受け付けていません

Learning the RoPEs: Better 2D and 3D Position Encodings with STRING

要約 STRINGを紹介する:Separable Translation Inv … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, stat.ML | Learning the RoPEs: Better 2D and 3D Position Encodings with STRING はコメントを受け付けていません

The TIP of the Iceberg: Revealing a Hidden Class of Task-in-Prompt Adversarial Attacks on LLMs

要約 我々は、LLMに対する脱獄敵対的攻撃の新しいクラス、タスク・イン・プロンプ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR | The TIP of the Iceberg: Revealing a Hidden Class of Task-in-Prompt Adversarial Attacks on LLMs はコメントを受け付けていません

Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG

要約 大規模言語モデル(LLM)は、人間のようなテキスト生成と自然言語理解を可能 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.IR | Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG はコメントを受け付けていません

Posterior-Mean Rectified Flow: Towards Minimum MSE Photo-Realistic Image Restoration

要約 フォトリアリスティックな画像復元アルゴリズムは、通常、歪み尺度(例えば、P … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV, eess.SP | Posterior-Mean Rectified Flow: Towards Minimum MSE Photo-Realistic Image Restoration はコメントを受け付けていません