月別アーカイブ: 2025年4月

Exploring the Effect of Reinforcement Learning on Video Understanding: Insights from SEED-Bench-R1

要約 Chain of Thound(COT)の最近の進歩により、大規模な言語モ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Exploring the Effect of Reinforcement Learning on Video Understanding: Insights from SEED-Bench-R1 はコメントを受け付けていません

Any2Caption:Interpreting Any Condition to Caption for Controllable Video Generation

要約 現在のビデオ生成コミュニティ内の正確なユーザー意図解釈のボトルネックに対処 … 続きを読む

カテゴリー: cs.AI, cs.CV | Any2Caption:Interpreting Any Condition to Caption for Controllable Video Generation はコメントを受け付けていません

UniOcc: A Unified Benchmark for Occupancy Forecasting and Prediction in Autonomous Driving

要約 UNIOCCは、カメラ画像からの占有予測(つまり、歴史的情報に基づいて将来 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MA, cs.RO | UniOcc: A Unified Benchmark for Occupancy Forecasting and Prediction in Autonomous Driving はコメントを受け付けていません

Free360: Layered Gaussian Splatting for Unbounded 360-Degree View Synthesis from Extremely Sparse and Unposed Views

要約 ニューラルレンダリングは、高品質の3D神経再構成と密な入力ビューと正確なポ … 続きを読む

カテゴリー: cs.CV | Free360: Layered Gaussian Splatting for Unbounded 360-Degree View Synthesis from Extremely Sparse and Unposed Views はコメントを受け付けていません

Consistent Subject Generation via Contrastive Instantiated Concepts

要約 テキストから画像への生成モデルは、多様で忠実なコンテンツを合成できますが、 … 続きを読む

カテゴリー: cs.CV | Consistent Subject Generation via Contrastive Instantiated Concepts はコメントを受け付けていません

SU-YOLO: Spiking Neural Network for Efficient Underwater Object Detection

要約 水中オブジェクトの検出は、海洋研究と産業安全検査にとって重要です。 ただし … 続きを読む

カテゴリー: cs.CV, cs.NE | SU-YOLO: Spiking Neural Network for Efficient Underwater Object Detection はコメントを受け付けていません

Easi3R: Estimating Disentangled Motion from DUSt3R Without Training

要約 Dust3Rの最近の進歩により、静的なシーンの密なポイント雲とカメラパラメ … 続きを読む

カテゴリー: cs.CV | Easi3R: Estimating Disentangled Motion from DUSt3R Without Training はコメントを受け付けていません

Evil twins are not that evil: Qualitative insights into machine-generated prompts

要約 言語モデル(LMS)は、予測可能な方法で、一見理解できないように見えるアル … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Evil twins are not that evil: Qualitative insights into machine-generated prompts はコメントを受け付けていません

EQ-Negotiator: An Emotion-Reasoning LLM Agent in Credit Dialogues

要約 大規模な言語モデル(LLM)ベースのチャットボットは、クレジットの対話に効 … 続きを読む

カテゴリー: cs.CL | EQ-Negotiator: An Emotion-Reasoning LLM Agent in Credit Dialogues はコメントを受け付けていません

ActionStudio: A Lightweight Framework for Data and Training of Large Action Models

要約 アクションモデルは、自律エージェントが複雑なタスクを実行できるようにするた … 続きを読む

カテゴリー: cs.AI, cs.CL | ActionStudio: A Lightweight Framework for Data and Training of Large Action Models はコメントを受け付けていません