月別アーカイブ: 2024年6月

Photometry of Saturated Stars with Neural Networks

要約 全天超新星自動探査 (ASAS-SN) では、マルチレベル パーセプトロン … 続きを読む

カテゴリー: astro-ph.IM, astro-ph.SR, cs.CV | Photometry of Saturated Stars with Neural Networks はコメントを受け付けていません

Prism: A Framework for Decoupling and Assessing the Capabilities of VLMs

要約 ビジョン言語モデル (VLM) は、強力な知覚能力と推論能力を必要とする、 … 続きを読む

カテゴリー: cs.CL, cs.CV | Prism: A Framework for Decoupling and Assessing the Capabilities of VLMs はコメントを受け付けていません

Consistency Models Made Easy

要約 整合性モデル (CM) は、従来の拡散モデルよりも高速なサンプリングを提供 … 続きを読む

カテゴリー: cs.CV, cs.LG | Consistency Models Made Easy はコメントを受け付けていません

Uncovering Latent Memories: Assessing Data Leakage and Memorization Patterns in Large Language Models

要約 大規模な言語モデルの急増により、自然言語処理タスクに革命が起こりましたが、 … 続きを読む

カテゴリー: cs.CV, cs.LG, q-bio.NC | Uncovering Latent Memories: Assessing Data Leakage and Memorization Patterns in Large Language Models はコメントを受け付けていません

Advancing Fine-Grained Classification by Structure and Subject Preserving Augmentation

要約 詳細な視覚的分類 (FGVC) には、密接に関連したサブクラスの分類が含ま … 続きを読む

カテゴリー: cs.CV | Advancing Fine-Grained Classification by Structure and Subject Preserving Augmentation はコメントを受け付けていません

A Survey of Multimodal-Guided Image Editing with Text-to-Image Diffusion Models

要約 画像編集は、ユーザーからの特定の要件を満たすために、指定された合成画像また … 続きを読む

カテゴリー: cs.CV | A Survey of Multimodal-Guided Image Editing with Text-to-Image Diffusion Models はコメントを受け付けていません

Asynchronous Large Language Model Enhanced Planner for Autonomous Driving

要約 リアルタイム プランナーは自動運転において顕著なパフォーマンスを示していま … 続きを読む

カテゴリー: cs.CV, cs.RO | Asynchronous Large Language Model Enhanced Planner for Autonomous Driving はコメントを受け付けていません

Whiteboard-of-Thought: Thinking Step-by-Step Across Modalities

要約 視覚的思考を伴う質問が提示されると、人間は自然に推論方法を切り替え、しばし … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Whiteboard-of-Thought: Thinking Step-by-Step Across Modalities はコメントを受け付けていません

Transformers Can Represent $n$-gram Language Models

要約 既存の研究では、計算の形式的なモデルを使用して、変圧器アーキテクチャの表現 … 続きを読む

カテゴリー: cs.AI, cs.CC, cs.CL, cs.FL, cs.LG | Transformers Can Represent $n$-gram Language Models はコメントを受け付けていません

A Single Graph Convolution Is All You Need: Efficient Grayscale Image Classification

要約 画像分類器はタスクを畳み込みニューラル ネットワーク (CNN) に依存す … 続きを読む

カテゴリー: cs.CV, cs.LG | A Single Graph Convolution Is All You Need: Efficient Grayscale Image Classification はコメントを受け付けていません