「cs.LG」カテゴリーアーカイブ

DyCoke: Dynamic Compression of Tokens for Fast Video Large Language Models

投稿日: 2025年3月31日作成者: jarxiv

要約ビデオ大規模な言語モデル（VLLM）は、最近、複雑なビデオコンテンツの処理 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Masked Self-Supervised Pre-Training for Text Recognition Transformers on Large-Scale Datasets

投稿日: 2025年3月31日作成者: jarxiv

要約自己学習学習は、さまざまなドメインのモデルパフォーマンスを改善するために、 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Evaluating the evaluators: Towards human-aligned metrics for missing markers reconstruction

投稿日: 2025年3月31日作成者: jarxiv

要約アニメーションデータは、光学マーカーの位置を確立するために多数のカメラを利 … 続きを読む →

カテゴリー: cs.CV, cs.HC, cs.LG | コメントを受け付けていません

AnnoPage Dataset: Dataset of Non-Textual Elements in Documents with Fine-Grained Categorization

投稿日: 2025年3月31日作成者: jarxiv

要約 1485年から現在まで、19世紀後半から20世紀初頭に焦点を当てた、主にチ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Leveraging Expert Input for Robust and Explainable AI-Assisted Lung Cancer Detection in Chest X-rays

投稿日: 2025年3月31日作成者: jarxiv

要約ディープラーニングモデルは、特に胸部X線などの医療イメージモダリティを介し … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Deterministic Medical Image Translation via High-fidelity Brownian Bridges

投稿日: 2025年3月31日作成者: jarxiv

要約最近の研究では、拡散モデルは、生成的敵対ネットワーク（GAN）と比較した場 … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

Using AI to Summarize US Presidential Campaign TV Advertisement Videos, 1952-2012

投稿日: 2025年3月31日作成者: jarxiv

要約このペーパーでは、デジタル形式で入手可能な米国大統領キャンペーンテレビ広告 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

USC: Uncompromising Spatial Constraints for Safety-Oriented 3D Object Detectors in Autonomous Driving

投稿日: 2025年3月31日作成者: jarxiv

要約この作業では、自律運転コンテキストでの3Dオブジェクト検出器の安全指向のパ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

RelDenClu: A Relative Density based Biclustering Method for identifying non-linear feature relations

投稿日: 2025年3月31日作成者: jarxiv

要約多くの場合、特徴関係に基づいたバイカルスターを見つけるための既存のバイクラ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

RAP: Retrieval-Augmented Personalization for Multimodal Large Language Models

投稿日: 2025年3月31日作成者: jarxiv

要約大規模な言語モデル（LLMS）の開発は、一般的なアシスタントとしてマルチモ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

DyCoke: Dynamic Compression of Tokens for Fast Video Large Language Models

Masked Self-Supervised Pre-Training for Text Recognition Transformers on Large-Scale Datasets

Evaluating the evaluators: Towards human-aligned metrics for missing markers reconstruction

AnnoPage Dataset: Dataset of Non-Textual Elements in Documents with Fine-Grained Categorization

Leveraging Expert Input for Robust and Explainable AI-Assisted Lung Cancer Detection in Chest X-rays

Deterministic Medical Image Translation via High-fidelity Brownian Bridges

Using AI to Summarize US Presidential Campaign TV Advertisement Videos, 1952-2012

USC: Uncompromising Spatial Constraints for Safety-Oriented 3D Object Detectors in Autonomous Driving

RelDenClu: A Relative Density based Biclustering Method for identifying non-linear feature relations

RAP: Retrieval-Augmented Personalization for Multimodal Large Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー