Искусственный интеллект научился преобразовывать монофонический звук в трехмерный. Создатели технологии назвали полученный результат 2.5D-звуком.
Живая музыка всегда кажется более объемной. Это связано с тем, что мозг учитывает разницу во времени между появлением звука в каждом ухе, межуровневую разницу звука и сторону, откуда он исходит. При записи обычного стереозвука эти параметры не учитываются.
Один из способов преодоления этой проблемы является бинауральная запись, но для этого нужно разместить микрофон внутри каждого звука. Однако данный метод не является универсальным, поскольку каждое ухо уникально.
Исследователям из Техасского университета и Facebook удалось решить эту проблему с помощью визуальных сигналов. Для этого они совместили видеоряд с монофоническим звуком, а затем задействовали искусственный интеллект, который определяет откуда поступают звуки, а затем искажает межуровневую и временную разницы для создания трехмерного эффекта.