月別アーカイブ: 2025年1月

ICONS: Influence Consensus for Vision-Language Data Selection

投稿日: 2025年1月7日作成者: jarxiv

要約視覚的命令の調整には通常、大量の視覚言語トレーニングデータが必要です。 … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Autoregressive Image Diffusion: Generation of Image Sequence and Application in MRI

投稿日: 2025年1月7日作成者: jarxiv

要約磁気共鳴画像法 (MRI) は、広く使用されている非侵襲性画像診断法です。 … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

Dispider: Enabling Video LLMs with Active Real-Time Interaction via Disentangled Perception, Decision, and Reaction

投稿日: 2025年1月7日作成者: jarxiv

要約ビデオ LLM とのアクティブなリアルタイムインタラクションは、人間とコ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

ProTracker: Probabilistic Integration for Robust and Accurate Point Tracking

投稿日: 2025年1月7日作成者: jarxiv

要約この論文では、ビデオ内の任意の点の堅牢かつ正確な長期高密度追跡のための新し … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

RW-Net: Enhancing Few-Shot Point Cloud Classification with a Wavelet Transform Projection-based Network

投稿日: 2025年1月7日作成者: jarxiv

要約 3D オブジェクト分類の領域では、ラベル付きデータの不足に対処することが根 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Rate-My-LoRA: Efficient and Adaptive Federated Model Tuning for Cardiac MRI Segmentation

投稿日: 2025年1月7日作成者: jarxiv

要約心血管疾患 (CVD) と心臓の同期不全は、米国の主要な公衆衛生上の問題で … 続きを読む →

カテゴリー: cs.CV, cs.DC, cs.LG | コメントを受け付けていません

Automated Generation of Challenging Multiple-Choice Questions for Vision Language Model Evaluation

投稿日: 2025年1月7日作成者: jarxiv

要約ビジョン言語モデル (VLM) の迅速な開発には、厳密で信頼性の高い評価が … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.CY, cs.LG | コメントを受け付けていません

Gaussian Masked Autoencoders

投稿日: 2025年1月7日作成者: jarxiv

要約このペーパーでは、ガウススプラッティングを使用したマスクオートエンコー … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

QuArch: A Question-Answering Dataset for AI Agents in Computer Architecture

投稿日: 2025年1月7日作成者: jarxiv

要約 QuArch は、言語モデルによるコンピューターアーキテクチャの理解を評 … 続きを読む →

カテゴリー: cs.AI, cs.AR, cs.LG | コメントを受け付けていません

MixGCN: Scalable GCN Training by Mixture of Parallelism and Mixture of Accelerators

投稿日: 2025年1月7日作成者: jarxiv

要約グラフ畳み込みネットワーク (GCN) は、グラフベースの学習タスクにおい … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

月別アーカイブ: 2025年1月

ICONS: Influence Consensus for Vision-Language Data Selection

Autoregressive Image Diffusion: Generation of Image Sequence and Application in MRI

Dispider: Enabling Video LLMs with Active Real-Time Interaction via Disentangled Perception, Decision, and Reaction

ProTracker: Probabilistic Integration for Robust and Accurate Point Tracking

RW-Net: Enhancing Few-Shot Point Cloud Classification with a Wavelet Transform Projection-based Network

Rate-My-LoRA: Efficient and Adaptive Federated Model Tuning for Cardiac MRI Segmentation

Automated Generation of Challenging Multiple-Choice Questions for Vision Language Model Evaluation

Gaussian Masked Autoencoders

QuArch: A Question-Answering Dataset for AI Agents in Computer Architecture

MixGCN: Scalable GCN Training by Mixture of Parallelism and Mixture of Accelerators

最近の投稿

最近のコメント

アーカイブ

カテゴリー