Конволуционе неуронске мреже (ЦНН) су прво дизајниране за препознавање слика у области компјутерског вида. Ове мреже су специјализована врста вештачке неуронске мреже која се показала веома ефикасном у анализи визуелних података. Развој ЦНН-а је био вођен потребом за стварањем модела који би могли прецизно да класификују и категоризују слике, а њихов успех у овом домену довео је до њихове широке употребе у разним другим апликацијама као што су детекција објеката, сегментација слике, па чак и обрада природног језика.
ЦНН су инспирисани структуром и функционалношћу визуелног кортекса у људском мозгу. Као и визуелни кортекс, ЦНН се састоје од више слојева међусобно повезаних неурона који обрађују различите аспекте улазних података. Кључна иновација ЦНН-а лежи у њиховој способности да аутоматски уче и издвајају релевантне карактеристике из слика, елиминишући потребу за ручним инжењерингом карактеристика. Ово се постиже употребом конволуционих слојева, који примењују филтере на улазну слику да би открили различите визуелне обрасце и карактеристике, као што су ивице, углови и текстуре.
Први напредак у ЦНН-у дошао је увођењем архитектуре ЛеНет-5 од стране Ианн ЛеЦун ет ал. 1998. ЛеНет-5 је посебно дизајниран за препознавање руком писаних цифара и постигао је изузетне перформансе на скупу података МНИСТ, референтном скупу података који се широко користи за процену алгоритама за препознавање слика. ЛеНет-5 је показао моћ ЦНН-а у хватању хијерархијских карактеристика са слика, омогућавајући тачну класификацију чак и у присуству варијација у размери, ротацији и преводу.
Од тада, ЦНН-ови су значајно еволуирали, са дубљом и сложенијом архитектуром која се развија. Један значајан напредак било је увођење АлекНет архитектуре од стране Алекса Крижевског и др. у 2012. АлекНет је постигао напредак у класификацији слика победивши на ИмагеНет Ларге Сцале Висуал Рецогнитион Цхалленге (ИЛСВРЦ) са значајно нижом стопом грешке у поређењу са претходним приступима. Овај успех је отворио пут широком усвајању ЦНН-а у задацима препознавања слика.
ЦНН-ови су такође успешно примењени на друге задатке компјутерског вида. На пример, у детекцији објеката, ЦНН се могу комбиновати са додатним слојевима да би се локализовали и класификовали објекти унутар слике. Чувена конволуциона неуронска мрежа заснована на региону (Р-ЦНН) коју су представили Росс Гирсхицк ет ал. 2014. је пример такве архитектуре. Р-ЦНН је постигао најсавременије резултате у мерилима детекције објеката користећи моћ ЦНН-а за екстракцију карактеристика и комбинујући је са методама предлога региона.
Конволуционе неуронске мреже су прво дизајниране за задатке препознавања слика у области компјутерског вида. Они су револуционисали ову област аутоматским учењем релевантних карактеристика са слика, елиминишући потребу за ручним инжењерингом карактеристика. Развој ЦНН-а довео је до значајног напретка у класификацији слика, детекцији објеката и разним другим задацима компјутерског вида.
Остала недавна питања и одговори у вези ЕИТЦ/АИ/АДЛ Напредно дубинско учење:
- Зашто морамо да примењујемо оптимизације у машинском учењу?
- Када долази до претеривања?
- Да ли конволуционе неуронске мреже могу да рукују секвенцијалним подацима уграђујући конволуције током времена, као што се користи у моделима од конволуционих секвенци до секвенци?
- Да ли се генеративне адверсаријске мреже (ГАН) ослањају на идеју генератора и дискриминатора?