cs.AI」カテゴリーアーカイブ

SurgBox: Agent-Driven Operating Room Sandbox with Surgery Copilot

要約 外科的介入、特に神経内科における外科的介入は、外科チームに多大な認知的負担 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, cs.RO | SurgBox: Agent-Driven Operating Room Sandbox with Surgery Copilot はコメントを受け付けていません

Archaeoscape: Bringing Aerial Laser Scanning Archaeology to the Deep Learning Era

要約 航空機レーザー スキャン (ALS) テクノロジーは、密集した植生の下に隠 … 続きを読む

カテゴリー: cs.AI, cs.CV | Archaeoscape: Bringing Aerial Laser Scanning Archaeology to the Deep Learning Era はコメントを受け付けていません

CompCap: Improving Multimodal Large Language Models with Composite Captions

要約 マルチモーダル大規模言語モデル (MLLM) は合成画像をどの程度理解でき … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | CompCap: Improving Multimodal Large Language Models with Composite Captions はコメントを受け付けていません

From classical techniques to convolution-based models: A review of object detection algorithms

要約 オブジェクト検出は、コンピューター ビジョンと画像理解における基本的なタス … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | From classical techniques to convolution-based models: A review of object detection algorithms はコメントを受け付けていません

TeamCraft: A Benchmark for Multi-Modal Multi-Agent Systems in Minecraft

要約 コラボレーションは社会の基礎です。 現実の世界では、人間のチームメイトは多 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MA | TeamCraft: A Benchmark for Multi-Modal Multi-Agent Systems in Minecraft はコメントを受け付けていません

Extrapolated Urban View Synthesis Benchmark

要約 フォトリアリスティックなシミュレーターは、ビジョン中心の自動運転車 (AV … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Extrapolated Urban View Synthesis Benchmark はコメントを受け付けていません

MotionFlow: Attention-Driven Motion Transfer in Video Diffusion Models

要約 Text-to-Video モデルは、多様で魅力的なビデオ コンテンツを生 … 続きを読む

カテゴリー: cs.AI, cs.CV | MotionFlow: Attention-Driven Motion Transfer in Video Diffusion Models はコメントを受け付けていません

Stag-1: Towards Realistic 4D Driving Simulation with Video Generation Model

要約 現実的な自動運転シミュレーターの開発には4D運転シミュレーションが不可欠で … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Stag-1: Towards Realistic 4D Driving Simulation with Video Generation Model はコメントを受け付けていません

Artificial intelligence and the internal processes of creativity

要約 創造的な成果を生成できる人工知能 (AI) システムは、創造性に対する私た … 続きを読む

カテゴリー: cs.AI, cs.CY, q-bio.NC | Artificial intelligence and the internal processes of creativity はコメントを受け付けていません

EmbodiedOcc: Embodied 3D Occupancy Prediction for Vision-based Online Scene Understanding

要約 3D 占有予測は周囲のシーンの包括的な説明を提供し、3D 認識にとって不可 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | EmbodiedOcc: Embodied 3D Occupancy Prediction for Vision-based Online Scene Understanding はコメントを受け付けていません