Исследователи из TikTok, Гонконгского университета, Zhejiang Lab и Университета Чжэцзяна представили Depth Anything — новый метод оценки глубины изображения, который может упростить видеомонтаж.
![](https://cdn.shazoo.ru/730837_ZKXTVEQ_1.jpg)
Обученная на 1,5 миллионах размеченных и 62 миллионах неразмеченных изображений, эта модель монокулярной оценки глубины (MDE) демонстрирует впечатляющие возможности:
-
оценивает относительную глубину
-
оценивает метрическую глубину
-
оптимальна для дообучения и оценки на наборах данных NYUv2 и KITTI
![](https://cdn.shazoo.ru/730838_PuE35kj_1.jpg)
![](https://cdn.shazoo.ru/730839_zsOiqro_image.png)
Авторы хотят создать "простую, но мощную базовую модель, работающую с любыми изображениями в любых обстоятельствах" без использования новых технических модулей.
Больше примеров работы, код и данные для обучения можно найти на странице проекта.
Тем временем гуру Blender одобрил этот инструмент, отметив, что инди-кинематографисты будут рады забыть о ручном выделении объектов и людей.
https://twitter.com/Radio_poodle/status/1749411358846640366