SÚJV vyvíjí platformu pro rozpoznávání chorob rostlin

Zaměstnanci Laboratoře informačních technologií SÚJV vyvinuli online platformu pdd.jinr.ru pro identifikaci chorob domácích a zemědělských rostlin. K řešení problému byly použity konvoluční neuronové sítě, široce používané pro klasifikaci obrazů. Architektura neuronové sítě platformy je schopna rozpoznávat různé choroby a škůdce s přesností přes 95 %. Od začátku roku 2023 se počet tříd v obecném modelu pdd.jinr.ru zvýšil na 60 a objevilo se několik nových specializovaných modelů pro takové oblíbené domácí rostliny, jako jsou dracény a spathiphyllum.
Podle odhadů Organizace spojených národů pro výživu a zemědělství každoročně umírá až třetina světové úrody kvůli škůdcům a chorobám, proto se v současné době po celém světě usiluje o automatizaci rozpoznávání chorob rostlin. V roce 2017 získala skupina výzkumníků z Laboratoře informačních technologií SÚJV grant od Ruské nadace pro základní výzkum (RFBR) na vývoj komplexního systému pro diagnostiku chorob rostlin pomocí obrázků a textových popisů.
Byla vyvinuta platforma, která se dodnes rozvíjí a má několik vstupních bodů pro uživatele. Implementuje kolekci modelů: při zpracování požadavku algoritmus nejprve použije obecný model pro choroby a škůdce. Poté neuronová síť určí druh rostliny. Za předpokladu, že daná plodina má svůj vlastní model, uživatel obdrží kromě obecné také konkrétní prognózu. „Při vystavení výsledku se zobrazí tři nejbližší třídy k načtenému obrázku. Ve většině případů to vše umožňuje správně identifikovat chorobu a získat doporučení pro její léčbu,“ uvedl spoluautor studie, vedoucí programátor JINR LIT Alexandr Užinskij.
V současné době má pdd.jinr.ru modely pro 19 zemědělských a okrasných plodin: dřišťál, vinnou révu, třešně, borůvky, jahody, kukuřici, okurky, papriky, pšenici, rybíz, rajčata, bavlnu, jablka, orchideje, růže atd. Obecný model pro všechny druhy rostlin rozpoznává 55 různých chorob a škůdců. Databáze obsahuje přes 4000 40000 obrázků; od uživatelů bylo přijato přes XNUMX XNUMX požadavků. Rozhraní platformy může používat každý, od agroholdingů až po začínající zahradníky, pro které bude nemalý význam funkce programu s doporučeními pro ošetření rostlin ověřenými profesionálními agronomy.
„Uživatelé by měli mít k dispozici různé nástroje pro interakci s platformou. Úkoly rozpoznávání lze spouštět přes webový portál, ale hlavním vstupním bodem pro uživatele se stala mobilní aplikace DoctorP pro operační systém Android,“ vysvětlil Alexander Uzhinsky. Od spuštění aplikace ji využilo více než 10000 XNUMX lidí. V současné době se vyvíjí aplikace pro OS iOS.
Jak vysvětlil Alexandr Užinskij, pro klasifikaci obrázků se často používá osvědčená konvoluční neuronová síť, dříve trénovaná na velkém počtu obrázků. Její poslední vrstva, zodpovědná za klasifikaci, je nahrazena novou a následně probíhá další trénování na fotografiích z dané oblasti – tento přístup se nazývá „transferové učení“. K použití metody jsou zpravidla zapotřebí stovky obrázků. Zde se vědci potýkali s největší obtíží – shromážděním dostatečného počtu fotografií rostlin pro trénování neuronové sítě. Otevřené databáze dostupné v té době obsahovaly syntetické obrázky, které se velmi lišily od těch, se kterými se setkáváme v reálném životě: každý list byl odříznutý, narovnaný, byl na statickém pozadí a osvětlený stejným způsobem. „Tyto obrázky se dají pohodlně používat pro vědecké účely a dosáhli jsme dobrého výsledku – 99% rozpoznání, ale pak na fotografii pořízené uživateli v reálném životě model udělal chyby v 50 % případů. Stáli jsme před úkolem shromáždit databázi obrázků sami,“ pokračoval Alexandr Užinskij. Bylo nutné shromáždit co nejvíce snímků rostlin v terénu: za různého osvětlení, polohy, různých měřítků snímání atd. Obvykle jsou pro dosažení pozitivních výsledků pro každou určenou třídu zapotřebí stovky, nebo ještě lépe tisíce snímků.
V otevřených zdrojích: v online komunitách, na fórech – pro každou třídu chorob bylo pouze 20 až 50 obrázků a vývojáři museli použít speciální metody, aby i v podmínkách malého trénovacího vzorku dosáhli dobrého výsledku. K řešení problému byla použita siamská (dvojitá) neuronová síť, která, ačkoli se dříve nepoužívala ke klasifikaci rostlinných chorob, dobře rozlišovala tváře. „Tato technologie využívá identické sítě, kterým jsou na vstupu přiváděny dvojice obrázků stejných nebo různých tříd, a v důsledku trénování by se síť měla naučit dobře rozkládat vícerozměrné vektory obrázků různých tříd v prostoru vlastností. Díky tomu bylo při určování rostlinných chorob možné dosáhnout 98% přesnosti,“ komentoval vědec.
Platforma byla dvakrát optimalizována z důvodu zhoršení přesnosti výsledků s nárůstem počtu obrazových tříd v databázi. Poprvé byla za účelem zlepšení predikčních ukazatelů použita tříčlenná funkce minimalizace ztrát – přístup, který využívá tři neuronové sítě, kterým jsou přiváděny dva obrazy jedné třídy a jeden obraz druhé. Trénovací proces je zaměřen na to, aby se vektorové reprezentace obrazů jedné třídy v multidimenzionálním prostoru přiblížily a vektory obrazů různých tříd co nejvíce vzdálily.
Dalším krokem v optimalizaci architektury a trénovacího procesu bylo použití algoritmů pro vyhledávání optimálního nastavení augmentace (AutoAugment) – umělá změna obrázků, na kterých je neuronová síť trénována, pokud je těchto obrázků málo (například úhel objektu, jas, část objektu je oříznutá atd.). Základní neuronovou sítí v platformě navíc byla síť speciálně trénovaná na sadě obrázků rostlin. Výsledkem je, že i s více než 50 třídami v systému je přesnost modelů přes 95 %.
Autoři vyvinuli softwarové rozhraní, které umožňuje uživatelům třetích stran využívat zdroje platformy, například ve své mobilní aplikaci. Společnost „Garden Retail Service“ (dříve „Fasco“) tak do své mobilní aplikace HoGa zabudovala schopnost identifikovat nemoci. V rámci společného projektu s Národním centrem pro lékařský výzkum „Agrotechnologie budoucnosti“ založeným na Timiryazevově akademii byly k sledování vlivu osvětlení na vývoj rostlin použity modely neuronových sítí pdd.jinr.ru, což umožnilo vybrat optimální schémata pro pěstování zemědělských plodin.
Platforma se neustále rozvíjí. Databáze je aktualizována o fotografie uživatelů, čímž se zlepšuje přesnost modelů. V létě platforma přijímá především snímky zemědělských plodin: okurek, rajčat, jahod a dalších; v zimě převážně fotografie pokojových rostlin. V budoucnu bude platforma vybavena možnostmi zpracování video streamu, modely pro určování nedostatku esenciálních prvků (dusík, fosfor, vápník, železo atd.) a také nástroji pro generování doporučení pro pěstování a sledování vývoje nejoblíbenějších zemědělských plodin.
Vývoj platformy provedli vědci z LIT SÚJV: hlavní výzkumník Gennadij Ososkov, stážista Pavel Gončarov, přední programátoři Alexandr Užinsky a Andrej Nechaevskij a také magisterský specialista na strojové učení Artem Smetanin. V časopise Open Systems byl publikován článek Alexandra Uzhinského o vytvoření platformy pro rozpoznávání chorob rostlin. DBMS“ č. 3 pro rok 2022.
Informace poskytnuté tiskovou službou Spojeného ústavu jaderného výzkumu