投稿者「jarxiv」のアーカイブ

From Chat Logs to Collective Insights: Aggregative Question Answering

投稿日: 2025年5月30日作成者: jarxiv

要約大規模な言語モデル（LLM）を搭載した会話エージェントは、私たちの毎日の相 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Autoregressive Meta-Actions for Unified Controllable Trajectory Generation

投稿日: 2025年5月30日作成者: jarxiv

要約メタアクションと呼ばれる高レベルのセマンティック決定に導かれた制御可能な軌 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

One Trajectory, One Token: Grounded Video Tokenization via Panoptic Sub-object Trajectory

投稿日: 2025年5月30日作成者: jarxiv

要約効果的なビデオトークン化は、長いビデオのトランスモデルをスケーリングするた … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | コメントを受け付けていません

ZeroSep: Separate Anything in Audio with Zero Training

投稿日: 2025年5月30日作成者: jarxiv

要約オーディオソースの分離は、マシンが複雑な音響環境を理解し、多数のオーディオ … 続きを読む →

カテゴリー: cs.CV, cs.SD | コメントを受け付けていません

Color Image Set Recognition Based on Quaternionic Grassmannians

投稿日: 2025年5月30日作成者: jarxiv

要約 Quaternicのパワーを使用して色情報をキャプチャし、各カラー画像セッ … 続きを読む →

カテゴリー: cs.CV, math.AG | コメントを受け付けていません

Position: Interactive Generative Video as Next-Generation Game Engine

投稿日: 2025年5月30日作成者: jarxiv

要約現代のゲーム開発は、従来のゲームエンジンの所定のコンテンツにより、創造性と … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

UniViTAR: Unified Vision Transformer with Native Resolution

投稿日: 2025年5月30日作成者: jarxiv

要約従来のビジョントランスは、入力解像度を標準化することにより視覚モデリングを … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Comparing the Effects of Persistence Barcodes Aggregation and Feature Concatenation on Medical Imaging

投稿日: 2025年5月30日作成者: jarxiv

要約医療画像分析では、機能エンジニアリングは、機械学習モデルの設計とパフォーマ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

SynTable: A Synthetic Data Generation Pipeline for Unseen Object Amodal Instance Segmentation of Cluttered Tabletop Scenes

投稿日: 2025年5月30日作成者: jarxiv

要約この作業では、NVIDIAのISAAC SIMレプリケーターコンポーザーを … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

PanopticNeRF-360: Panoramic 3D-to-2D Label Transfer in Urban Scenes

投稿日: 2025年5月30日作成者: jarxiv

要約自動運転車のトレーニング認識システムには、マニュアルラベルから労働集約的な … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

From Chat Logs to Collective Insights: Aggregative Question Answering

Autoregressive Meta-Actions for Unified Controllable Trajectory Generation

One Trajectory, One Token: Grounded Video Tokenization via Panoptic Sub-object Trajectory

ZeroSep: Separate Anything in Audio with Zero Training

Color Image Set Recognition Based on Quaternionic Grassmannians

Position: Interactive Generative Video as Next-Generation Game Engine

UniViTAR: Unified Vision Transformer with Native Resolution

Comparing the Effects of Persistence Barcodes Aggregation and Feature Concatenation on Medical Imaging

SynTable: A Synthetic Data Generation Pipeline for Unseen Object Amodal Instance Segmentation of Cluttered Tabletop Scenes

PanopticNeRF-360: Panoramic 3D-to-2D Label Transfer in Urban Scenes

最近の投稿

最近のコメント

アーカイブ

カテゴリー