月別アーカイブ: 2024年4月

On the Content Bias in Fréchet Video Distance

要約 ビデオ生成モデルを評価するための著名な指標である Fr\’ec … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | On the Content Bias in Fréchet Video Distance はコメントを受け付けていません

Precise Asymptotics for Spectral Methods in Mixed Generalized Linear Models

要約 混合一般化線形モデルの目的は、ラベルのない観測から複数の信号を学習すること … 続きを読む

カテゴリー: cs.IT, cs.LG, math.IT, math.ST, stat.ML, stat.TH | Precise Asymptotics for Spectral Methods in Mixed Generalized Linear Models はコメントを受け付けていません

Can LLMs perform structured graph reasoning?

要約 事前トレーニングされた大規模言語モデル (LLM) は、特に非構造化タスク … 続きを読む

カテゴリー: cs.AI, cs.CL | Can LLMs perform structured graph reasoning? はコメントを受け付けていません

End-To-End Training and Testing Gamification Framework to Learn Human Highway Driving

要約 現在の自律スタックは十分にモジュール化されており、手作りのフレームワークで … 続きを読む

カテゴリー: cs.AI, cs.RO | End-To-End Training and Testing Gamification Framework to Learn Human Highway Driving はコメントを受け付けていません

FlexMap Fusion: Georeferencing and Automated Conflation of HD Maps with OpenStreetMap

要約 現在の自動運転車用のソフトウェア スタックは、HD マップに依存して、十分 … 続きを読む

カテゴリー: cs.RO | FlexMap Fusion: Georeferencing and Automated Conflation of HD Maps with OpenStreetMap はコメントを受け付けていません

Predicting Traffic Congestion at Urban Intersections Using Data-Driven Modeling

要約 都市部では交差点での交通渋滞が重大な問題となっており、通勤時間の増加、安全 … 続きを読む

カテゴリー: cs.LG | Predicting Traffic Congestion at Urban Intersections Using Data-Driven Modeling はコメントを受け付けていません

Octopus v3: Technical Report for On-device Sub-billion Multimodal AI Agent

要約 マルチモーダル AI エージェントは、自然言語、視覚、音声入力を含むさまざ … 続きを読む

カテゴリー: cs.CL, cs.CV | Octopus v3: Technical Report for On-device Sub-billion Multimodal AI Agent はコメントを受け付けていません

JointViT: Modeling Oxygen Saturation Levels with Joint Supervision on Long-Tailed OCTA

要約 血中の酸素飽和度 (SaO2) は、健康にとって、特に睡眠関連の呼吸障害に … 続きを読む

カテゴリー: cs.CV, eess.IV | JointViT: Modeling Oxygen Saturation Levels with Joint Supervision on Long-Tailed OCTA はコメントを受け付けていません

Dynamic Typography: Bringing Text to Life via Video Diffusion Prior

要約 テキスト アニメーションは表現媒体として機能し、言葉に動きを吹き込んで感情 … 続きを読む

カテゴリー: cs.CV | Dynamic Typography: Bringing Text to Life via Video Diffusion Prior はコメントを受け付けていません

TaCOS: Task-Specific Camera Optimization with Simulation

要約 アプリケーションにおけるロボットのパフォーマンスは、感覚入力の質に大きく依 … 続きを読む

カテゴリー: cs.CV, cs.RO | TaCOS: Task-Specific Camera Optimization with Simulation はコメントを受け付けていません