「68T45」カテゴリーアーカイブ

Hodge Laplacians and Hodge Diffusion Maps

投稿日: 2025年4月11日作成者: jarxiv

要約 Hodge Diffusion Mapsは、高次元データセットからトポロジ … 続きを読む →

カテゴリー: 68P05, 68T10, 68T45, 68W25, cs.LG | コメントを受け付けていません

SF2T: Self-supervised Fragment Finetuning of Video-LLMs for Fine-Grained Understanding

投稿日: 2025年4月11日作成者: jarxiv

要約ビデオベースの大規模な言語モデル（ビデオ-LLM）は、マルチモーダルLLM … 続きを読む →

カテゴリー: 68T45, cs.AI, cs.CV, I.4.8 | コメントを受け付けていません

BUFF: Bayesian Uncertainty Guided Diffusion Probabilistic Model for Single Image Super-Resolution

投稿日: 2025年4月7日作成者: jarxiv

要約超解像(SR)技術は、特に高解像度画像が不可欠でありながらハードウェアの制 … 続きを読む →

カテゴリー: 68T45, cs.AI, cs.CV, I.2.10 | コメントを受け付けていません

Vision-Language Models for Acute Tuberculosis Diagnosis: A Multimodal Approach Combining Imaging and Clinical Data

投稿日: 2025年4月2日作成者: jarxiv

要約背景：この研究では、自動化された急性結核（TB）スクリーニングのためのSi … 続きを読む →

カテゴリー: 68T07, 68T45, 68U10, 92C50, 92C55, cs.AI, cs.CV, cs.LG, eess.IV | コメントを受け付けていません

Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models

投稿日: 2025年4月1日作成者: jarxiv

要約自律運転における共変量シフト問題に対処するために、潜在空間生成世界モデルの … 続きを読む →

カテゴリー: (Primary), 68T45, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY, I.2.10 | コメントを受け付けていません

Socratic Planner: Self-QA-Based Zero-Shot Planning for Embodied Instruction Following

投稿日: 2025年3月27日作成者: jarxiv

要約次の具体化された命令（EIF）は、インタラクティブな環境でオブジェクトをナ … 続きを読む →

カテゴリー: (Primary), 68T45, 68T50, cs.AI, cs.CL, cs.CV, cs.RO | コメントを受け付けていません

Harmony: A Joint Self-Supervised and Weakly-Supervised Framework for Learning General Purpose Visual Representations

投稿日: 2025年3月27日作成者: jarxiv

要約クリップなどのビジョン言語対照学習フレームワークは、自然言語の監督から学習 … 続きを読む →

カテゴリー: 68T07, 68T45, cs.CV, cs.LG, I.2.10 | コメントを受け付けていません

Quality Over Quantity? LLM-Based Curation for a Data-Efficient Audio-Video Foundation Model

投稿日: 2025年3月13日作成者: jarxiv

要約マルチモーダルの基礎モデルをトレーニングするためのオーディオとビジュアルデ … 続きを読む →

カテゴリー: 68T, 68T10, 68T45, cs.CL, cs.IR, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

ForAug: Recombining Foregrounds and Backgrounds to Improve Vision Transformer Training with Bias Mitigation

投稿日: 2025年3月13日作成者: jarxiv

要約トランス、特にビジョントランス（VITS）は、大規模な画像分類で最先端のパ … 続きを読む →

カテゴリー: 68T45, cs.AI, cs.CV, cs.LG, I.2.10 | コメントを受け付けていません

Fast 3D point clouds retrieval for Large-scale 3D Place Recognition

投稿日: 2025年3月3日作成者: jarxiv

要約 3Dポイントクラウドでの検索は、3Dポイントの参照内で最も類似したポイント … 続きを読む →

カテゴリー: 68T10, 68T45, cs.CV, cs.IR, I.2.10 | コメントを受け付けていません