「cs.AI」カテゴリーアーカイブ

PP-DocLayout: A Unified Document Layout Detection Model to Accelerate Large-Scale Data Construction

投稿日: 2025年3月24日作成者: jarxiv

要約ドキュメントレイアウト分析は、ドキュメントインテリジェンスの重要な前処理ス … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Neuro-Symbolic Scene Graph Conditioning for Synthetic Image Dataset Generation

投稿日: 2025年3月24日作成者: jarxiv

要約機械学習モデルがスケールと複雑さを増加させるにつれて、十分なトレーニングデ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID

投稿日: 2025年3月24日作成者: jarxiv

要約熱赤外ビデオで複数の無人航空機（UAV）を検出および追跡することは、コント … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

RadioActive: 3D Radiological Interactive Segmentation Benchmark

投稿日: 2025年3月24日作成者: jarxiv

要約臨床医の努力を最小限に抑えた楽で正確なセグメンテーションは、臨床ワークフロ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.HC, cs.LG | コメントを受け付けていません

TruthPrInt: Mitigating LVLM Object Hallucination Via Latent Truthful-Guided Pre-Intervention

投稿日: 2025年3月24日作成者: jarxiv

要約オブジェクト幻覚（OH）は、大規模な視覚言語モデル（LVLMS）における主 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

DINO-LG: A Task-Specific DINO Model for Coronary Calcium Scoring

投稿日: 2025年3月24日作成者: jarxiv

要約世界中の死亡率の主要な原因の1つである冠動脈疾患（CAD）は、効果的なリス … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

Align Your Rhythm: Generating Highly Aligned Dance Poses with Gating-Enhanced Rhythm-Aware Feature Representation

投稿日: 2025年3月24日作成者: jarxiv

要約音楽によって駆動される自然で多様でリズミカルな人間のダンスの動きを自動的に … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Bridging Technology and Humanities: Evaluating the Impact of Large Language Models on Social Sciences Research with DeepSeek-R1

投稿日: 2025年3月24日作成者: jarxiv

要約近年、大規模な言語モデル（LLMS）の開発は、自然言語処理の分野で大きなブ … 続きを読む →

カテゴリー: cs.AI, cs.CY | コメントを受け付けていません

Moto: Latent Motion Token as the Bridging Language for Learning Robot Manipulation from Videos

投稿日: 2025年3月24日作成者: jarxiv

要約大規模なコーパスで事前に訓練された大規模な言語モデルの最近の開発は、微調整 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

SPINE: Online Semantic Planning for Missions with Incomplete Natural Language Specifications in Unstructured Environments

投稿日: 2025年3月24日作成者: jarxiv

要約ロボットがますます有能になるにつれて、ユーザーは高レベルのミッションを説明 … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

PP-DocLayout: A Unified Document Layout Detection Model to Accelerate Large-Scale Data Construction

Neuro-Symbolic Scene Graph Conditioning for Synthetic Image Dataset Generation

Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID

RadioActive: 3D Radiological Interactive Segmentation Benchmark

TruthPrInt: Mitigating LVLM Object Hallucination Via Latent Truthful-Guided Pre-Intervention

DINO-LG: A Task-Specific DINO Model for Coronary Calcium Scoring

Align Your Rhythm: Generating Highly Aligned Dance Poses with Gating-Enhanced Rhythm-Aware Feature Representation

Bridging Technology and Humanities: Evaluating the Impact of Large Language Models on Social Sciences Research with DeepSeek-R1

Moto: Latent Motion Token as the Bridging Language for Learning Robot Manipulation from Videos

SPINE: Online Semantic Planning for Missions with Incomplete Natural Language Specifications in Unstructured Environments

最近の投稿

最近のコメント

アーカイブ

カテゴリー