cs.AI」カテゴリーアーカイブ

On-orbit Servicing for Spacecraft Collision Avoidance With Autonomous Decision Making

要約 この研究では、宇宙船の衝突回避操作 (CAM) を支援する自律軌道上サービ … 続きを読む

カテゴリー: cs.AI | On-orbit Servicing for Spacecraft Collision Avoidance With Autonomous Decision Making はコメントを受け付けていません

Blox-Net: Generative Design-for-Robot-Assembly Using VLM Supervision, Physics Simulation, and a Robot with Reset

要約 生成 AI システムは、テキスト、コード、画像の作成において優れた機能を示 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Blox-Net: Generative Design-for-Robot-Assembly Using VLM Supervision, Physics Simulation, and a Robot with Reset はコメントを受け付けていません

Turn Every Application into an Agent: Towards Efficient Human-Agent-Computer Interaction with API-First LLM-Based Agents

要約 マルチモーダル大規模言語モデル (MLLM) により、LLM ベースのエー … 続きを読む

カテゴリー: cs.AI | Turn Every Application into an Agent: Towards Efficient Human-Agent-Computer Interaction with API-First LLM-Based Agents はコメントを受け付けていません

FineZip : Pushing the Limits of Large Language Models for Practical Lossless Text Compression

要約 言語モデリングの目的は圧縮と深く関係していることが示されていますが、現代の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | FineZip : Pushing the Limits of Large Language Models for Practical Lossless Text Compression はコメントを受け付けていません

Differential Privacy Regularization: Protecting Training Data Through Loss Function Regularization

要約 ニューラル ネットワークに基づいて機械学習モデルをトレーニングするには、機 … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.LG, cs.NE | Differential Privacy Regularization: Protecting Training Data Through Loss Function Regularization はコメントを受け付けていません

HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale

要約 GPT-4V などのマルチモーダル大規模言語モデル (MLLM) の急速な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale はコメントを受け付けていません

Generative Object Insertion in Gaussian Splatting with a Multi-View Diffusion Model

要約 新しいオブジェクトを生成して 3D コンテンツに挿入することは、多彩なシー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | Generative Object Insertion in Gaussian Splatting with a Multi-View Diffusion Model はコメントを受け付けていません

Go-SLAM: Grounded Object Segmentation and Localization with Gaussian Splatting SLAM

要約 3D ガウス スプラッティング SLAM を利用して、シーン表現内にオブジ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.RO | Go-SLAM: Grounded Object Segmentation and Localization with Gaussian Splatting SLAM はコメントを受け付けていません

RAP: Retrieval-Augmented Planner for Adaptive Procedure Planning in Instructional Videos

要約 教育ビデオでの手順計画には、初期状態と目標状態の視覚的観察に基づいて一連の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | RAP: Retrieval-Augmented Planner for Adaptive Procedure Planning in Instructional Videos はコメントを受け付けていません

DilateQuant: Accurate and Efficient Diffusion Quantization via Weight Dilation

要約 拡散モデルはさまざまな画像生成タスクで優れたパフォーマンスを示していますが … 続きを読む

カテゴリー: cs.AI, cs.CV | DilateQuant: Accurate and Efficient Diffusion Quantization via Weight Dilation はコメントを受け付けていません