Коломієць С. П. Аналіз існуючих методів локалізації на цифровому зображенні // Міжнародний науковий журнал "Інтернаука". — 2018. — №17. https://doi.org/10.25313/2520-2057-2018-17-4209
Технічні науки
УДК 620.179.680
Коломієць Світлана Петрівна
аспірант кафедри інформаційних технологій проектування
та прикладної математики
Київського національного університету будівництва і архітектури
Коломиец Светлана Петровна
аспирант кафедры информационных технологий проектирования
и прикладной математики
Киевского национального университета строительства и архитектуры
Kolomiyets Svetlana
Post-Graduate Student of the Department of Information Technology Design
and Applied Mathematics of the
Kyiv National University of Civil Engineering and Architecture
АНАЛІЗ ІСНУЮЧИХ МЕТОДІВ ЛОКАЛІЗАЦІЇ НА ЦИФРОВОМУ ЗОБРАЖЕННІ
АНАЛИЗ СУЩЕСТВУЮЩИХ МЕТОДОВ ЛОКАЛИЗАЦИИ НА ЦИФРОВОМ ИЗОБРАЖЕНИИ
THE ANALYSIS OF EXISTING METHODS FOR THE LOCALIZATION OF THE DIGITAL IMAGE
Анотація. Виходячи з природи утворення дефекту типу тріщина, стає очевидним, що створити еталон тріщини неможливо і розпізнання доцільно проводити на основі багатоетапного алгоритму на основі послідовного застосування класифікаційних ознак, де однією з важливих і складних операцій є локалізація. В роботі проведено огляд та аналіз існуючих методів локалізації на цифровому зображенні.
Ключові слова: цифрове зображення, дефект типу "тріщина", локалізація, адаптивні методи.
Аннотация. Исходя из природы образования дефекта типа трещина, становится очевидным, что создать эталон трещины невозможно и распознавания целесообразно проводить на основе многоэтапного алгоритма на основе последовательного применения классификационных признаков, где одним из важных и сложных операций является локализация. В работе проведен обзор и анализ существующих методов локализации на цифровом изображении.
Ключевые слова: цифровое изображение, дефект типа "трещина", локализация, адаптивные методы.
Summary. Because of the nature of defects such crack, it becomes apparent that a standard can not crack and recognition should be performed based on multistage algorithm based on consistent application of classifications where one of the important and complex operations is localization. In this paper, a review and analysis of existing methods of localization in a digital image.
Key words: digital image, the defect of "crack", localization, adaptive methods.
Актуальність та аналіз проблеми. На працездатність і терміни служби конструкцій значний вплив мають пошкодження, що виникають в процесі експлуатації, і накопичуючись та розвиваючись, можуть призвести до відмов у роботі як окремих елементів, так і будівельних споруд в цілому [1]. Для виявлення та класифікації таких пошкоджень проводять моніторинг технічного стану об’єктів будівництва, який дозволяє попереджати виникнення небажаних та аварійних ситуацій. Пошкодження залізобетонних і кам'яних конструкцій у більшості випадків неминуче супроводжується утворенням тріщин. Вивчення тріщин в бетоні і цегляній кладці, причин їх виникнення, а також можливості ремонту конструкцій – найбільш важливий момент в загальній проблемі відновлення і підсилення цих конструкцій.
Сьогодні особлива увага приділяється методам неруйнівного контролю сутність яких полягає у аналізі динаміки зміни технічного стану об’єктів будівництва, а саме прогнозуванні, виявленні та класифікації дефектів без активного впливу на об’єкт моніторингу. Найбільш поширеним методом неруйнівного контролю є оптичний метод, який полягає в дослідженні цифрового зображення за допомогою різноманітних засобів.
Мета роботи. Методи розпізнання об'єктів на цифрових зображень поділяють на методи на основі еталону та без еталону. Виходячи з природи утворення дефекту типу тріщина, що обумовлює їх різноманіття, зрозуміло, що створити еталон тріщини неможливо і розпізнання доцільно проводити на основі багатоетапного алгоритму на основі послідовного застосування класифікаційних ознак, де однією з важливих і складних операцій є локалізація – виявлення об'єктів на зображенні та визначення їхніх координат. Необхідність локалізації, як процедури визначення області дефекту, обумовлена наступними причинами [2]:
Також на процедуру виявлення такого об'єкту як тріщина значною мірою впливають такі фактори, як оптичні засоби та умови отримання зображення, що обумовлює якість знімку та характеристики поверхні і матеріалу, що складають фон для розпізнання дефекту:
Застосування методів локалізації дозволяє обійти деякі із зазначених вище недоліків представлення дефекту на цифровому зображенні та значною мірою полегшити подальший процес розпізнавання. В даній роботі проведений аналіз існуючих методів локалізації для цифрових зображень з метою визначення кращих з них для застосування розпізнання дефектів типу тріщина.
Аналіз існуючих методів локалізації. Класифікація сучасних алгоритмів локалізації об'єктів на цифровому зображенні представлена в таблиці 1 [3].
Таблиця 1
Класифікація сучасних алгоритмів локалізації
Типи методів |
Методи |
Алгоритми вейвлет -перетворень |
Алгоритм двомірних вейвлетів Бінаризація пікселів у вейвлет - домені |
Нейронні мережі |
Метод головних компонент |
Алгоритми виділення країв |
Алгоритм Робертса. Алгоритм Превітта Алгоритм Собеля. Перетворення Хафа Алгоритм ковзаючого вікна. HOG-фільтр |
Порогова обробка |
Обробка адаптивним порогом Обробка глобальним порогом Алгоритм Отсу |
Методи сегментації |
Сегментація перетворенням водорозділу |
Кореляційне зіставлення |
Алгоритм SIFT. Алгоритм Бустінг Алгоритм SURF. Алгоритм Бутстреппінг Алгоритм сумка візуальних слів Алгоритм AdaBoost (Discreet) |
Методи триангуляції |
Time of Arrival. Time of Flight Round Trip Time. Time Difference of Arrival Receive Signal Strength. Angle of Arrival |
Алгоритми вейвлет-перетворень використовуються для зменшення рівня шумів, аналізу текстур, виділення контурів об'єктів і стиснення зображень. Незалежно від виду функції (зображення, крива, поверхня) вейвлет представляє функцію як ієрархію рівнів відображення з різною точністю деталізації, що дає можливість скоротити час обробки зображення та визначити найбільш точні початкові наближення для обробки нижніх рівнів за результатами обробки верхніх рівнів. Недоліком алгоритмів є те, що під час обробки зображення зменшується вплив слабких шумових сигналів та знижується об’єм інформації, необхідної для представлення сигналу [10].
Більшість задач, які вирішують за допомогою нейронних мереж (НМ), пов’язана із розпізнаванням образів. Архітектура і функціонування НМ мають біологічні прообрази. Такі параметри НМ як вагові коефіцієнти в нейронній мережі не обчислюються шляхом рішення аналітичних рівнянь, а підлаштовуються різними локальними методами при навчанні. Навчаються НМ на наборі навчальних прикладів. В процесі навчання НМ відбувається автоматичний витяг ключових ознак, визначення їх важливості та побудова взаємозв’язків між ними. Навчена НМ може успішно застосовувати досвід, отриманий в процесі навчання, на невідомі образи за рахунок хороших узагальнюючих здібностей. Але, незважаючи на це, застосування НМ до зображень потребує додаткових зусиль. Це пов’язано зі складним характером зображень, зміною умов освітлення та топологічними спотвореннями зображення при зміні ракурсу [5].
Алгоритми виділення країв будуються на базі високочастотних фільтрів, які використовуються, в свою чергу, для виділення перепадів яскравості – посилюють різкі перепади на зображенні, в той час як плавні подавляються; виділяють крайові пікселі, в яких різко змінюється локальна яскравість зображення. Як правило, різку зміну яскравості можна визначити аналізуючи першу похідну функції яскравості, яка характеризує величину градієнта. Границя об’єкта на зображенні зазвичай перпендикулярна вектору градієнта. Високочастотні фільтри апроксимують обчислення похідних по напрямку. При цьому похідна дорівнює одиниці або двом. В масках високочастотних фільтрів частина коефіцієнтів має від’ємні значення, але сума всіх коефіцієнтів маски дорівнює нулю, що означає обчислення різниці значень яскравості сусідніх пікселів. Для прискорення обчислення всі коефіцієнти, як правило, цілочисельні. Недоліком таких алгоритмів є те, що вони не враховують локальних особливостей зображення, і якщо зображення містить дуже темні і дуже світлі ділянки, то вони не можуть забезпечити якісного покращення зображення на цих ділянках [4].
Основна проблема операції порогового перетворення полягає у виборі належного значення порога. Визначення оптимального порогу при перетворенні зображень є важливим і важким завданням, і для його вирішення розроблено багато різних методів. Локальна порогова обробка характеризується тим, що зображення розбивається на підобласті, в кожній з яких для сегментації використовується своє значення порога. Основні проблеми при такому підході - це як розбити вихідне зображення і як оцінити поріг для кожної отриманої області. Оскільки поріг, застосований для кожного пікселя, виявляється залежним від характеристик підобласті, що містить даний піксель, то таке граничне перетворення є адаптивним. Якщо у випадку глобальних методів для обчислення порога аналізується гістограма всього зображення, то при локальних методах порогового перетворення досліджуються гістограми фрагментів зображення [8].
Головна ідея алгоритмів сегментації полягає в знаходженні відповідності або відмінностей в характеристиках пікселів – взаємному розміщенні, яскравості, кольорі та текстурі. Сегментація має дві основні цілі: декомпозицію зображення на частини, більш зручні для подальшого аналізу та зміну форми опису зображення. Недоліком алгоритмів сегментації є врахування великої кількості даних предметної області [9].
Кореляційне зіставлення полягає в порівнянні поточного зображення з еталоном і ґрунтується на розгляді зображення як двовимірної функції яскравості (дискретної двовимірної матриці інтенсивності). При цьому вимірюється або відстань між зображеннями, або міра їх близькості. На підставі отриманого значення максимальної кореляції перевіряється достовірність детектування. Якщо, то зіставлення визнається достовірним. В іншому випадку зображення вважається нерозпізнаним. Важливі недоліки кореляційних методів зіставлення проявляються у присутності радіометричних (яскравісних) і особливо геометричних спотворень поточного зображення в порівнянні з еталонним. Зокрема, спостерігається швидке зменшення кореляційного зв'язку при так званих ракурсних спотвореннях, наприклад, при поворотах зображень [7].
Методи тріангуляції використовуються для рішення задачі локалізації деякої точки площини на тріангуляційній сітці – пошуку трикутника, в який вона попадає. Недоліком методів тріангуляції є втрата точності внутрішніх обчислень [6].
Висновок. Так як тріщина – складний об’єкт на цифровому зображенні, локалізація якого потребує певного обсягу апріорної інформації, то для процедури його виявлення доцільно застосовувати комплексний адаптивний підхід на основі методів обробки адаптивним порогом, сегментації та виділення країв.
Література