投稿者「jarxiv」のアーカイブ

Mouse Lockbox Dataset: Behavior Recognition for Mice Solving Lockboxes

投稿日: 2025年6月18日作成者: jarxiv

要約機械学習とコンピュータービジョンの方法は、自然動物の行動の研究に大きな影響 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Navigating the Digital World as Humans Do: Universal Visual Grounding for GUI Agents

投稿日: 2025年6月18日作成者: jarxiv

要約マルチモーダル大手言語モデル（MLLMS）は、グラフィカルユーザーインター … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Align Your Flow: Scaling Continuous-Time Flow Map Distillation

投稿日: 2025年6月18日作成者: jarxiv

要約拡散およびフローベースのモデルは、最先端の生成モデリングアプローチとして浮 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Unsupervised Imaging Inverse Problems with Diffusion Distribution Matching

投稿日: 2025年6月18日作成者: jarxiv

要約この作業では、対応のないデータセットを使用して、逆の問題のレンズを介した画 … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

VisText-Mosquito: A Multimodal Dataset and Benchmark for AI-Based Mosquito Breeding Site Detection and Reasoning

投稿日: 2025年6月18日作成者: jarxiv

要約蚊媒介性疾患は、大規模な世界的な健康リスクをもたらし、発生を防ぐために繁殖 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Infinity: Scaling Bitwise AutoRegressive Modeling for High-Resolution Image Synthesis

投稿日: 2025年6月18日作成者: jarxiv

要約私たちは、言語命令に続いて高解像度の光エアリスティックな画像を生成できるビ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

3DGS-IEval-15K: A Large-scale Image Quality Evaluation Database for 3D Gaussian-Splatting

投稿日: 2025年6月18日作成者: jarxiv

要約 3Dガウススプラッティング（3DG）は、新しいビュー合成の有望なアプローチ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Diverse Topology Optimization using Modulated Neural Fields

投稿日: 2025年6月18日作成者: jarxiv

要約トポロジの最適化（to）は、正式な問題の説明から最適に近い幾何学を導き出す … 続きを読む →

カテゴリー: cond-mat.mtrl-sci, cs.AI, cs.CV, cs.LG | コメントを受け付けていません

ONEBench to Test Them All: Sample-Level Benchmarking Over Open-Ended Capabilities

投稿日: 2025年6月18日作成者: jarxiv

要約従来の固定テストセットは、基礎モデルのオープンエンド機能の評価に不足してい … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

DDS-NAS: Dynamic Data Selection within Neural Architecture Search via On-line Hard Example Mining applied to Image Classification

投稿日: 2025年6月18日作成者: jarxiv

要約ニューラルアーキテクチャ検索（NAS）内のスケーラビリティチャレンジに対処 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

Mouse Lockbox Dataset: Behavior Recognition for Mice Solving Lockboxes

Navigating the Digital World as Humans Do: Universal Visual Grounding for GUI Agents

Align Your Flow: Scaling Continuous-Time Flow Map Distillation

Unsupervised Imaging Inverse Problems with Diffusion Distribution Matching

VisText-Mosquito: A Multimodal Dataset and Benchmark for AI-Based Mosquito Breeding Site Detection and Reasoning

Infinity: Scaling Bitwise AutoRegressive Modeling for High-Resolution Image Synthesis

3DGS-IEval-15K: A Large-scale Image Quality Evaluation Database for 3D Gaussian-Splatting

Diverse Topology Optimization using Modulated Neural Fields

ONEBench to Test Them All: Sample-Level Benchmarking Over Open-Ended Capabilities

DDS-NAS: Dynamic Data Selection within Neural Architecture Search via On-line Hard Example Mining applied to Image Classification

最近の投稿

最近のコメント

アーカイブ

カテゴリー