Toshiba Corporation har udviklet en AI med 3D-genkendelse, der er i stand til at måle afstand med nøjagtigheden af et stereokamera ved at bruge billedet taget med et kommercielt kamera og analysere sløring af billedet forårsaget af kameralinsen ved hjælp af dyb læring. Denne teknologi fjerner brugen af stereokameraer, hvilket i sidste ende reducerer omkostningerne og pladsen. Toshiba præsenterer denne præstation på den internationale konference om computersyn (ICCV2019), der afholdes i Sydkorea den 30. oktober 2019 fra kl. 10.
Billedføling bliver vigtigere, og applikationer som robotter, der bevæger objekter, autonome ubemandede køretøjer, fjernstyrede droner, der inspicerer infrastruktur osv., Kræver mere end bare billeder af motiverne, de har brug for en lille enhed til at analysere 3D-data for at inkludere form og afstand. Derfor er forskningen blevet øget for at udvikle en målingsteknologi med monokulære kameraer (de er lette at miniaturisere) ved hjælp af dyb læring til bedre læring af form, baggrund og andre landskabsdata for det afbildede objekt.
Denne metode har en ulempe; afstandens nøjagtighed estimeres ved hjælp af et monokulært kamera afhængigt af indlærte landskabsdata, der forårsager et nøjagtighedsfald på grund af de skud, der er taget i forskellige landskaber. For at overvinde dette har Toshiba udviklet farvefiltreret blændefotografering, hvor der er fastgjort to farvefilter til linsen, og farven og størrelsen på den resulterende sløring af billedet analyseres i henhold til afstanden fra motivet. Selvom dette løser problemet med dataafhængighed, koster det tid og penge at ændre eksisterende linser.
Toshiba har overvundet dette problem ved at udvikle AI med 3D-genkendelsesteknologi, der bruger dyb læring til at analysere, hvordan billedet er sløret i henhold til dets position på linsen for at opnå afstandsmåling med den samme høje præcision som et stereokamerasystem, med et normalt monokulært kamera, men uden behov for landskabsdata. Indtil nu blev det anset for teoretisk umuligt at måle afstanden baseret på sløringen, hvilket er det samme for objekter med både afstand og langt, når de er lige langt fra brændpunktet. Men de analytiske resultater har vist en væsentlig forskel mellem slørformerne nær og fjerntliggende objekter, selv de er lige langt fra brændpunktet. Dermed analyserede Toshiba med succes sløringsdata fra optagne billeder ved hjælp af et dybt læringsmodul, der er trænet med den dybe neurale netværksmodel.
Når lyset passerer gennem linsen, vides det, at den oprettede sløring skifter afhængigt af lysets bølgelængde og dets position i linsen. I det udviklede netværk behandles position og farve separat for korrekt at opfatte ændringer i slørform og derefter efter at have passeret gennem en vægtet opmærksomhedsmekanisme for at kontrollere, hvor på lysstyrkegradienten der skal fokuseres for korrekt at måle afstanden. Gennem læring opdateres netværket derefter for at reducere en fejl mellem den målte afstand og den faktiske afstand. Ved hjælp af dette AI-modul har Toshiba bekræftet, at et enkelt billede taget med et kommercielt tilgængeligt kamera realiserer den samme afstandsmålingsnøjagtighed, der er sikret med stereokameraer. Flere oplysninger kan findes på denne officielle side af Toshiba.
Toshiba vil bekræfte systemets alsidighed med kommercielt tilgængelige kameraer og linser og fremskynde billedbehandlingen med henblik på offentlig implementering i regnskabsåret 2020.