投稿者「jarxiv」のアーカイブ

From Chat Logs to Collective Insights: Aggregative Question Answering

要約 大規模な言語モデル(LLM)を搭載した会話エージェントは、私たちの毎日の相 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | From Chat Logs to Collective Insights: Aggregative Question Answering はコメントを受け付けていません

Autoregressive Meta-Actions for Unified Controllable Trajectory Generation

要約 メタアクションと呼ばれる高レベルのセマンティック決定に導かれた制御可能な軌 … 続きを読む

カテゴリー: cs.CV, cs.RO | Autoregressive Meta-Actions for Unified Controllable Trajectory Generation はコメントを受け付けていません

One Trajectory, One Token: Grounded Video Tokenization via Panoptic Sub-object Trajectory

要約 効果的なビデオトークン化は、長いビデオのトランスモデルをスケーリングするた … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | One Trajectory, One Token: Grounded Video Tokenization via Panoptic Sub-object Trajectory はコメントを受け付けていません

ZeroSep: Separate Anything in Audio with Zero Training

要約 オーディオソースの分離は、マシンが複雑な音響環境を理解し、多数のオーディオ … 続きを読む

カテゴリー: cs.CV, cs.SD | ZeroSep: Separate Anything in Audio with Zero Training はコメントを受け付けていません

Color Image Set Recognition Based on Quaternionic Grassmannians

要約 Quaternicのパワーを使用して色情報をキャプチャし、各カラー画像セッ … 続きを読む

カテゴリー: cs.CV, math.AG | Color Image Set Recognition Based on Quaternionic Grassmannians はコメントを受け付けていません

Position: Interactive Generative Video as Next-Generation Game Engine

要約 現代のゲーム開発は、従来のゲームエンジンの所定のコンテンツにより、創造性と … 続きを読む

カテゴリー: cs.CV | Position: Interactive Generative Video as Next-Generation Game Engine はコメントを受け付けていません

UniViTAR: Unified Vision Transformer with Native Resolution

要約 従来のビジョントランスは、入力解像度を標準化することにより視覚モデリングを … 続きを読む

カテゴリー: cs.CV | UniViTAR: Unified Vision Transformer with Native Resolution はコメントを受け付けていません

Comparing the Effects of Persistence Barcodes Aggregation and Feature Concatenation on Medical Imaging

要約 医療画像分析では、機能エンジニアリングは、機械学習モデルの設計とパフォーマ … 続きを読む

カテゴリー: cs.AI, cs.CV | Comparing the Effects of Persistence Barcodes Aggregation and Feature Concatenation on Medical Imaging はコメントを受け付けていません

SynTable: A Synthetic Data Generation Pipeline for Unseen Object Amodal Instance Segmentation of Cluttered Tabletop Scenes

要約 この作業では、NVIDIAのISAAC SIMレプリケーターコンポーザーを … 続きを読む

カテゴリー: cs.CV | SynTable: A Synthetic Data Generation Pipeline for Unseen Object Amodal Instance Segmentation of Cluttered Tabletop Scenes はコメントを受け付けていません

PanopticNeRF-360: Panoramic 3D-to-2D Label Transfer in Urban Scenes

要約 自動運転車のトレーニング認識システムには、マニュアルラベルから労働集約的な … 続きを読む

カテゴリー: cs.CV | PanopticNeRF-360: Panoramic 3D-to-2D Label Transfer in Urban Scenes はコメントを受け付けていません