投稿者「jarxiv」のアーカイブ

Open CaptchaWorld: A Comprehensive Web-based Platform for Testing and Benchmarking Multimodal LLM Agents

要約 Captchasは、実際のアプリケーションにWebエージェントを展開するた … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Open CaptchaWorld: A Comprehensive Web-based Platform for Testing and Benchmarking Multimodal LLM Agents はコメントを受け付けていません

Keyed Chaotic Masking: A Functional Privacy Framework for Neural Inference

要約 この作業では、暗号化されたカオスダイナミカルシステムに由来する決定論的でユ … 続きを読む

カテゴリー: 37N25, 68T05, 94A60, cs.AI, cs.CR, D.4.6 | Keyed Chaotic Masking: A Functional Privacy Framework for Neural Inference はコメントを受け付けていません

OpenUni: A Simple Baseline for Unified Multimodal Understanding and Generation

要約 このレポートでは、マルチモーダルの理解と生成を統合するためのシンプルで軽量 … 続きを読む

カテゴリー: cs.CV | OpenUni: A Simple Baseline for Unified Multimodal Understanding and Generation はコメントを受け付けていません

ZPressor: Bottleneck-Aware Compression for Scalable Feed-Forward 3DGS

要約 フィードフォワード3Dガウススプラッティング(3DGS)モデルは最近、新し … 続きを読む

カテゴリー: cs.CV | ZPressor: Bottleneck-Aware Compression for Scalable Feed-Forward 3DGS はコメントを受け付けていません

Automatic classification of stop realisation with wav2vec2.0

要約 現代の音声研究は、音声データの注釈のために自動ツールを定期的に使用していま … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Automatic classification of stop realisation with wav2vec2.0 はコメントを受け付けていません

Anomalies by Synthesis: Anomaly Detection using Generative Diffusion Models for Off-Road Navigation

要約 オフロードおよび非構造化されていない環境で安全かつ確実にナビゲートするため … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Anomalies by Synthesis: Anomaly Detection using Generative Diffusion Models for Off-Road Navigation はコメントを受け付けていません

GrowSplat: Constructing Temporal Digital Twins of Plants with Gaussian Splats

要約 植物の成長の正確な時間的再構成は、植物の表現型と繁殖には不可欠ですが、植物 … 続きを読む

カテゴリー: cs.CV, cs.RO | GrowSplat: Constructing Temporal Digital Twins of Plants with Gaussian Splats はコメントを受け付けていません

Semantic Exploration and Dense Mapping of Complex Environments using Ground Robots Equipped with LiDAR and Panoramic Camera

要約 このペーパーでは、Lidar-Panoramic Camera Suite … 続きを読む

カテゴリー: cs.AI, cs.RO | Semantic Exploration and Dense Mapping of Complex Environments using Ground Robots Equipped with LiDAR and Panoramic Camera はコメントを受け付けていません

TwinTrack: Bridging Vision and Contact Physics for Real-Time Tracking of Unknown Dynamic Objects

要約 手元の操作中など、接触が豊富な環境で以前に見えなかった非常に動的なオブジェ … 続きを読む

カテゴリー: cs.RO | TwinTrack: Bridging Vision and Contact Physics for Real-Time Tracking of Unknown Dynamic Objects はコメントを受け付けていません

Spring-Brake! Handed Shearing Auxetics Improve Efficiency of Hopping and Standing

要約 エネルギー効率は、脚のあるロボット工学の成功にとって重要です。 効率は、運 … 続きを読む

カテゴリー: cs.RO, cs.SY, eess.SY | Spring-Brake! Handed Shearing Auxetics Improve Efficiency of Hopping and Standing はコメントを受け付けていません