月別アーカイブ: 2024年9月

Turn Every Application into an Agent: Towards Efficient Human-Agent-Computer Interaction with API-First LLM-Based Agents

要約 マルチモーダル大規模言語モデル (MLLM) により、LLM ベースのエー … 続きを読む

カテゴリー: cs.AI | Turn Every Application into an Agent: Towards Efficient Human-Agent-Computer Interaction with API-First LLM-Based Agents はコメントを受け付けていません

FineZip : Pushing the Limits of Large Language Models for Practical Lossless Text Compression

要約 言語モデリングの目的は圧縮と深く関係していることが示されていますが、現代の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | FineZip : Pushing the Limits of Large Language Models for Practical Lossless Text Compression はコメントを受け付けていません

Differential Privacy Regularization: Protecting Training Data Through Loss Function Regularization

要約 ニューラル ネットワークに基づいて機械学習モデルをトレーニングするには、機 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.LG, cs.NE | Differential Privacy Regularization: Protecting Training Data Through Loss Function Regularization はコメントを受け付けていません

Event-Free Moving Object Segmentation from Moving Ego Vehicle

要約 動的シーンにおける移動物体セグメンテーション (MOS) は、自動運転、特 … 続きを読む

カテゴリー: cs.CV, cs.RO | Event-Free Moving Object Segmentation from Moving Ego Vehicle はコメントを受け付けていません

YCB-Ev 1.1: Event-vision dataset for 6DoF object pose estimation

要約 私たちの研究では、これらのモダリティを使用して 6DoF オブジェクトの姿 … 続きを読む

カテゴリー: cs.CV | YCB-Ev 1.1: Event-vision dataset for 6DoF object pose estimation はコメントを受け付けていません

Moner: Motion Correction in Undersampled Radial MRI with Unsupervised Neural Representation

要約 ラジアル MRI における動き補正 (MoCo) は、被験者の動きが予測で … 続きを読む

カテゴリー: cs.CV, eess.IV | Moner: Motion Correction in Undersampled Radial MRI with Unsupervised Neural Representation はコメントを受け付けていません

Game4Loc: A UAV Geo-Localization Benchmark from Game Data

要約 UAV 用のビジョンベースの地理位置特定テクノロジーは、全地球航法衛星シス … 続きを読む

カテゴリー: cs.CV | Game4Loc: A UAV Geo-Localization Benchmark from Game Data はコメントを受け付けていません

HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale

要約 GPT-4V などのマルチモーダル大規模言語モデル (MLLM) の急速な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale はコメントを受け付けていません

Generative Object Insertion in Gaussian Splatting with a Multi-View Diffusion Model

要約 新しいオブジェクトを生成して 3D コンテンツに挿入することは、多彩なシー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | Generative Object Insertion in Gaussian Splatting with a Multi-View Diffusion Model はコメントを受け付けていません

Going Beyond U-Net: Assessing Vision Transformers for Semantic Segmentation in Microscopy Image Analysis

要約 セグメンテーションは、顕微鏡画像解析における重要なステップです。 過去数年 … 続きを読む

カテゴリー: cs.CV, eess.IV | Going Beyond U-Net: Assessing Vision Transformers for Semantic Segmentation in Microscopy Image Analysis はコメントを受け付けていません