-
最近の投稿
- The Best of Both Worlds: Integrating Language Models and Diffusion Models for Video Generation
- Predicate Debiasing in Vision-Language Models Integration for Scene Graph Generation Enhancement
- AlignDiT: Multimodal Aligned Diffusion Transformer for Synchronized Speech Generation
- LDPoly: Latent Diffusion for Polygonal Road Outline Extraction in Large-Scale Topographic Mapping
- SpaRE: Enhancing Spatial Reasoning in Vision-Language Models with Synthetic Data
-
最近のコメント
表示できるコメントはありません。 cs.AI (37272) cs.CL (28197) cs.CV (43007) cs.HC (2848) cs.LG (42202) cs.RO (22093) cs.SY (3374) eess.IV (5002) eess.SY (3366) stat.ML (5517)
「I.2」カテゴリーアーカイブ
Enhancing Suicide Risk Assessment: A Speech-Based Automated Approach in Emergency Medicine
要約 救急部門での専門的な精神医学的評価と自殺傾向のリスクのある患者へのケアへの … 続きを読む
Pathological Primitive Segmentation Based on Visual Foundation Model with Zero-Shot Mask Generation
要約 医療画像処理では、独特の画像特性と、特に病理学における領域固有の課題のため … 続きを読む
Semantically-correlated memories in a dense associative model
要約 私は、相関高密度連想記憶 (CDAM) という名前の新しい連想記憶モデルを … 続きを読む
Control-DAG: Constrained Decoding for Non-Autoregressive Directed Acyclic T5 using Weighted Finite State Automata
要約 有向非巡回トランスフォーマーは、ニューラル機械翻訳で優れたパフォーマンスを … 続きを読む
Semantically-correlated memories in a dense associative model
要約 私は、相関高密度連想記憶 (CDAM) という名前の新しい連想記憶モデルを … 続きを読む
ActNetFormer: Transformer-ResNet Hybrid Method for Semi-Supervised Action Recognition in Videos
要約 ビデオ内の人間のアクションやアクティビティの認識は、監視と監視、自動運転車 … 続きを読む
Fact-Checking Generative AI: Ontology-Driven Biological Graphs for Disease-Gene Link Verification
要約 さまざまな生成 AI ツールが発表されて以来、科学者は、その生成能力に対す … 続きを読む
Incorporating Recklessness to Collaborative Filtering based Recommender Systems
要約 レコメンダー・システムは、信頼性とカバー率のジレンマと本質的に結びついてい … 続きを読む
As Good As A Coin Toss: Human detection of AI-generated images, videos, audio, and audiovisual stimuli
要約 合成メディアが次第にリアルになり、それを利用する障壁が下がり続けるにつれ、 … 続きを読む