cs.LG」カテゴリーアーカイブ

DyCoke: Dynamic Compression of Tokens for Fast Video Large Language Models

要約 ビデオ大規模な言語モデル(VLLM)は、最近、複雑なビデオコンテンツの処理 … 続きを読む

カテゴリー: cs.CV, cs.LG | DyCoke: Dynamic Compression of Tokens for Fast Video Large Language Models はコメントを受け付けていません

Masked Self-Supervised Pre-Training for Text Recognition Transformers on Large-Scale Datasets

要約 自己学習学習は、さまざまなドメインのモデルパフォーマンスを改善するために、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Masked Self-Supervised Pre-Training for Text Recognition Transformers on Large-Scale Datasets はコメントを受け付けていません

Evaluating the evaluators: Towards human-aligned metrics for missing markers reconstruction

要約 アニメーションデータは、光学マーカーの位置を確立するために多数のカメラを利 … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.LG | Evaluating the evaluators: Towards human-aligned metrics for missing markers reconstruction はコメントを受け付けていません

AnnoPage Dataset: Dataset of Non-Textual Elements in Documents with Fine-Grained Categorization

要約 1485年から現在まで、19世紀後半から20世紀初頭に焦点を当てた、主にチ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | AnnoPage Dataset: Dataset of Non-Textual Elements in Documents with Fine-Grained Categorization はコメントを受け付けていません

Leveraging Expert Input for Robust and Explainable AI-Assisted Lung Cancer Detection in Chest X-rays

要約 ディープラーニングモデルは、特に胸部X線などの医療イメージモダリティを介し … 続きを読む

カテゴリー: cs.CV, cs.LG | Leveraging Expert Input for Robust and Explainable AI-Assisted Lung Cancer Detection in Chest X-rays はコメントを受け付けていません

Deterministic Medical Image Translation via High-fidelity Brownian Bridges

要約 最近の研究では、拡散モデルは、生成的敵対ネットワーク(GAN)と比較した場 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Deterministic Medical Image Translation via High-fidelity Brownian Bridges はコメントを受け付けていません

Using AI to Summarize US Presidential Campaign TV Advertisement Videos, 1952-2012

要約 このペーパーでは、デジタル形式で入手可能な米国大統領キャンペーンテレビ広告 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | Using AI to Summarize US Presidential Campaign TV Advertisement Videos, 1952-2012 はコメントを受け付けていません

USC: Uncompromising Spatial Constraints for Safety-Oriented 3D Object Detectors in Autonomous Driving

要約 この作業では、自律運転コンテキストでの3Dオブジェクト検出器の安全指向のパ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | USC: Uncompromising Spatial Constraints for Safety-Oriented 3D Object Detectors in Autonomous Driving はコメントを受け付けていません

RelDenClu: A Relative Density based Biclustering Method for identifying non-linear feature relations

要約 多くの場合、特徴関係に基づいたバイカルスターを見つけるための既存のバイクラ … 続きを読む

カテゴリー: cs.CV, cs.LG | RelDenClu: A Relative Density based Biclustering Method for identifying non-linear feature relations はコメントを受け付けていません

RAP: Retrieval-Augmented Personalization for Multimodal Large Language Models

要約 大規模な言語モデル(LLMS)の開発は、一般的なアシスタントとしてマルチモ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | RAP: Retrieval-Augmented Personalization for Multimodal Large Language Models はコメントを受け付けていません