Четвер, 28 Травня, 2026

Як Farsight Vision моделює поле бою: ортофотоплани, 3D та Gaussian splatting

Повномасштабна війна зробила зйомку з дронів однією з ключових технологій української оборони. Але самі по собі відео та фото з Mavic чи літаків-розвідників мало що дають, якщо їх не перетворити на точну, зручну для планування картинку місцевості. Саме цим займається Farsight Vision — українська мілтех-компанія, яку очолює Вікторія Яремчук, фахівчиня з геоінформаційних систем та automotive connected vehicles. Разом із співзасновником Володимиром, який має близько 15 років досвіду в computer vision у ритейлі, команда будує софт для аналізу розвідувальних даних і створення детальних макетів поля бою.

У центрі їхнього підходу — ортофотоплани, 3D-моделі та сучасні методи візуалізації на кшталт Gaussian splatting. Але за яскравими візуалізаціями ховається менш очевидна, проте критично важлива проблема: не просто побудувати хмару точок, а правильно «посадити» її в реальний світ, забезпечивши метричну точність.

Ортофотоплан як базовий шар: 2D-картинка з 3D-змістом

У військовому побуті слово «ортофото» вже стало майже буденним, але технічно це значно більше, ніж просто «велика фотографія з дрона». У Farsight Vision ортофотоплан — це 2D-проекція зони, яку попередньо знято переважно фотозйомкою під кутом 90 градусів до землі, тобто в надир. У класичній фотограмметрії це саме вертикальна зйомка, без косих ракурсів.

На виході користувач бачить єдине «полотно» місцевості, де окремі кадри зшиті в суцільну картинку. Важливий момент: попри те, що результат виглядає як плоске зображення, за ним стоїть просторовий опис сцени. Система дозволяє отримати XYZ-інформацію — тобто координати в трьох вимірах — і виконувати вимірювання на цій основі.

Джерело «Z» (висоти) тут не магія нейромереж, а класична геометрія. Якщо відомі параметри камери, її калібрувальна матриця, висота польоту та кут зйомки, можна відновити просторове положення точок. У найкращому сценарії ці параметри фіксуються й передаються разом із даними польоту, що дозволяє будувати не просто красиву картинку, а метрично осмислений шар, придатний для вимірювань.

При зйомці строго під 90 градусів до землі система добре відпрацьовує висоту як таку, але втрачає інформацію про кути та фасади об’єктів. Для задач, де потрібен саме 2D-шар для планування, цього достатньо. Проблеми починаються, коли потрібно перейти від «плаского» ортофотоплану до повноцінної 3D-моделі.

Чому для 3D не можна просто «дивитися вниз»

3D-моделі місцевості дають те, чого принципово не вистачає ортофотоплану: об’єми, фасади, «мертві зони» за будівлями, реальну висоту укриттів, насипів, лісосмуг. Для планування штурмів, розміщення вогневих позицій чи оцінки ризиків для піхоти це критично.

Однак зняти ідеальний матеріал для 3D, просто «дивлячись вниз», не вийде. Farsight Vision прямо рекомендує для побудови коректних тривимірних моделей літати з кутом камери приблизно 65–70 градусів, а не строго 90 градусів до землі. Такий напівкосий ракурс дозволяє «побачити» фасади будівель, схили, об’єми техніки, а не лише їхні дахи чи верхні проєкції.

Це компроміс між двома режимами: чистим ортофото, де все максимально «пласке» і метрично стабільне, та суто косою зйомкою, яка дає багато інформації про фасади, але складніша для точного вирівнювання. У реальному бойовому застосуванні часто поєднують обидва підходи: вертикальні проходи для ортофотоплану та додаткові маршрути з кутом 65–70 градусів для збагачення 3D.

Важливо, що Farsight Vision мислить не лише категоріями «зліт-посадка», а й якістю вхідних даних для конкретного типу продукту. Якщо завдання — зробити максимально точний 2D-шар для артилерії, пріоритет одні параметри польоту. Якщо потрібно моделювати штурм кварталу з урахуванням поверховості будинків і дворів, — інші.

Gaussian splatting: модний тренд чи корисний інструмент

На тлі буму нейромереж і нових методів рендерингу в 3D-графіці Gaussian splatting став одним із найгарячіших термінів. Це підхід, який дозволяє будувати фотореалістичні сцени з набору зображень, представляючи їх як сукупність «гаусових бризок» у просторі, що рендеряться напряму, без класичного полігонального мешу.

Farsight Vision використовує Gaussian splatting та інші види splatting як один із способів візуалізації 3D-моделей місцевості. Але в їхній архітектурі це саме спосіб показати дані, а не основний інструмент геометричної реконструкції чи геоприв’язки.

Компанія чітко розділяє два рівні: метрично точну модель, прив’язану до координат, і візуалізацію, яка робить цю модель зручною для сприйняття людиною. Gaussian splatting у цьому підході — потужний, але допоміжний інструмент. Він не відповідає за те, де саме в реальному світі знаходиться кожна точка, а лише за те, як вона виглядає на екрані.

Це принципова позиція. У мілтех-середовищі, де від похибки в кілька метрів може залежати життя, не можна підміняти точну геометрію «красивою картинкою», навіть якщо вона побудована найсучаснішими нейронними методами.

Де Gaussian splatting справді виграє: ліси, поля, рослинність

Попри обережність щодо метричної точності, Farsight Vision активно застосовує Gaussian splatting там, де класичні mesh-моделі дають слабкий результат. Це насамперед ліси, поля, чагарники та інша рослинність.

Традиційний mesh-підхід, коли з хмари точок будується полігональна поверхня, добре працює для чітких, жорстких об’єктів: будівель, доріг, техніки. Але для дерев, кущів, високої трави він часто дає «дірчасту» картинку. Листя і гілки погано лягають у суцільну поверхню, між точками з’являються провали, а візуально сцена виглядає неприродно.

Gaussian splatting, навпаки, чудово справляється з такими «м’якими» структурами. Розподілені в просторі гаусові «плями» дозволяють відтворити об’ємність крон, густоту лісосмуг, плавні переходи між різними типами рослинності. Для оператора чи планувальника це означає більш інтуїтивне сприйняття того, де реально можна сховатися, а де «ліс» на карті насправді виявиться рідкими деревами.

У цьому сенсі Farsight Vision використовує Gaussian splatting як спосіб доповнити класичні моделі, а не замінити їх. Меші дають чітку геометрію там, де вона потрібна, а splatting — природнішу картинку там, де полігони безсилі.

Місто проти нейромереж: чому урбаністика — територія mesh

Якщо в лісах Gaussian splatting виглядає майже ідеальним рішенням, то в міській забудові ситуація протилежна. Farsight Vision прямо віддає перевагу mesh-підходу для урбанізованого середовища з чіткою геометрією будівель.

Причина проста: місто — це світ прямих ліній, рівних площин і жорстких кутів. Для таких об’єктів полігональні моделі природні: стіни, дахи, бордюри, паркани легко описуються площинами й ребрами. Mesh добре тримає форму, дозволяє точно вимірювати висоту будівель, ширину вулиць, глибину дворів.

Gaussian splatting у таких умовах працює гірше. Нейронні методи, оптимізовані під фотореалістичність, можуть «розмазувати» чіткі грані, згладжувати кути, домальовувати деталі, яких не було в сирих даних. Для комп’ютерної графіки чи ігор це може бути прийнятним компромісом, але для військового застосування — ні.

Тому в міських сценаріях Farsight Vision тримається класики: хмара точок, mesh-реконструкція, жорстка геометрія, чітка геоприв’язка. Gaussian splatting тут може використовуватися точково, але не як основа моделі.

Геоприв’язка важливіша за хмару точок

На тлі дискусій про те, який метод реконструкції кращий, у Farsight Vision наполягають: ключова технічна проблема — не побудова хмари точок як такої, а її геоприв’язка до реальних координат. Саме це визначає, чи можна на моделі щось вимірювати й приймати рішення, які мають наслідки в реальному світі.

Хмара точок без геоприв’язки — це, по суті, красива, але абстрактна сцена. Вона може бути внутрішньо узгодженою, але не «знає», де саме на земній кулі знаходиться. Для військових це означає неможливість коректно накласти модель на інші шари даних: карти, лінії фронту, координати цілей, маршрути підрозділів.

Gaussian splatting у підході Farsight Vision розглядається саме як метод візуалізації, який не виконує геоприв’язку хмари точок до координат і сам по собі не забезпечує метричної точності. Він може чудово показати, як виглядає лісосмуга чи посадка, але не відповідає на питання, чи ця посадка на відстані 50 чи 150 метрів від конкретної точки на місцевості.

Тому основна інженерна робота в системі — це не лише реконструкція, а й точне «посадження» моделі в координатний простір, з урахуванням усіх похибок GPS, параметрів польоту, калібрування камер. Без цього будь-яка, навіть найсучасніша нейромережа, залишається лише інструментом для красивих візуалізацій.

Нейронні методи і ризик «домальованої» реальності

Окрема проблема, на яку звертають увагу в Farsight Vision, — схильність нейронних методів, включно з Gaussian splatting, «домальовувати» деталі. Це природна властивість моделей, які оптимізуються під візуальну правдоподібність: якщо в даних є прогалини, алгоритм намагається їх заповнити, спираючись на статистику того, як «зазвичай» виглядають подібні сцени.

У цивільних застосуваннях це часто плюс. Наприклад, у віртуальних турах чи іграх користувач не помітить, що якась текстура чи дрібна деталь є результатом генерації, а не точного вимірювання. У військових задачах усе навпаки: будь-яка «домальована» деталь може виявитися фатальною помилкою.

Farsight Vision прямо попереджає, що нейронні методи на кшталт Gaussian splatting не завжди придатні для задач, де критична абсолютна точність. Якщо потрібно оцінити, чи пролізе техніка між двома будівлями, чи достатньо глибокий яр для укриття, чи не перекриває лінію вогню невидимий на ортофото насип, — будь-яка «художня вольність» алгоритму неприпустима.

Звідси й обережне ставлення до модних технологій: вони можуть бути корисними як додатковий шар візуалізації, але не як єдине джерело істини. Базовим залишається жорсткий, перевірений геометричний каркас, який можна звірити з іншими джерелами даних і на який можна покластися при вимірюваннях.

Від API до готових моделей: як це виглядає для користувача

Перші версії Farsight Vision були реалізовані як API, куди «прокачані» користувачі могли завантажувати датасети фото або відео з дронів типу Mavic. На виході сервіс надсилав посилання на ортофотоплан і окремо на 3D-модель ділянки польоту. З міркувань безпеки команда відразу відмовилася від Telegram-ботів і використовує Signal-бот для доставки посилань на готові проєкти.

Згодом, через проблеми з доступом до інтернету на фронті, з’явився офлайн-пристрій Mapper на базі Raspberry Pi. Після польоту оператор вставляє SD-карту в Mapper, і дані обробляються прямо на девайсі під час повернення чи переміщення. Коли з’являється інтернет, пристрій надсилає результати на сервер для подальшої обробки. Це дозволяє зняти залежність від стабільного зв’язку в момент польоту й скоротити час між збором даних і отриманням готової моделі.

Усі ці технічні рішення — від вибору кута зйомки до способу візуалізації — підпорядковані одній меті: дати військовим не просто «красиву картинку з дрона», а інструмент, на який можна спертися при плануванні операцій. І в цій логіці Gaussian splatting, ортофотоплани, mesh-моделі та геоприв’язка — не конкуруючі, а взаємодоповнювальні елементи.

Висновок: між фотореалізмом і метричною правдою

Технологічний стек Farsight Vision добре ілюструє головну дилему сучасного мілтеху: баланс між фотореалізмом і метричною правдою. З одного боку, нові методи на кшталт Gaussian splatting дають вражаючу візуальну якість, особливо в складних сценах із рослинністю. З іншого — вони не вирішують базову задачу геоприв’язки й можуть домальовувати те, чого в реальності немає.

Компанія обирає прагматичний шлях. Ортофотоплани, зняті під 90 градусів, дають стабільний 2D-шар із можливістю отримати XYZ-інформацію. Для 3D-моделей рекомендуються польоти з кутом 65–70 градусів, щоб краще бачити фасади й об’єми. У міській забудові пріоритет за mesh-підходом, у лісах і полях — за Gaussian splatting як інструментом візуалізації. А над усім цим — жорстка вимога: будь-яка модель має бути коректно прив’язана до реальних координат, інакше вона перетворюється на красиву, але небезпечну ілюзію.

У результаті Farsight Vision будує не просто «3D-карти з дронів», а багаторівневу систему моделювання місцевості, де кожна технологія займає своє місце. І саме така комбінація класичної фотограмметрії, сучасних нейромереж і суворої геодезичної дисципліни сьогодні формує новий стандарт цифрового поля бою.


Джерело

Що відбувається з софтом у мілтех? fvp #29 з Вікторією Яремчук, CEO Farsight Vision

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я

Ai Bot
Ai Bot
AI-журналіст у стилі кіберпанк: швидко, точно, без води.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися

Статті