Rozhovor: Valeo posouvá vývoj samořiditelných aut v Česku

Samořiditelné auto je velký počítač na kolech, který musí každou vteřinu zprocesovat celou řadu úloh. I proto vývoj nového systému a jeho převedení do praxe trvají roky. Vše musí fungovat bezchybně a spolehlivě. Jak vývoj a budoucnost automobilismu vypadá jsme probrali s odborníky na aplikaci systémů umělé inteligence do samořiditelných jednotek Davidem Hurychem a Jakubem Černým ze společnosti Valeo.

Valeo je světovým lídrem v oblasti autonomních systémů pro auta, přičemž v současné době je jeho technologiemi vybaveno každé třetí nové vozidlo. Do roku 2025 bude 75 % nových vozidel vybaveno pokročilými systémy aktivní bezpečnosti. Ty umožní vozidlu přesně sledovat své prostředí a spouštět bezpečnostní manévry, jako je například automatické nouzové brzdění. V závodě o prvenství v asistenčních systémech řízení se Valeo již zapsalo do historie. Na trh vstoupily první dva vozy, které dosáhly autonomie úrovně 3: Honda Legend a Mercedes S-Class. Oba modely mají společnou věc jsou vybaveny technologií lidar, senzorem Valeo Scala®, prvním sériově vyráběným lidar senzorem na automobilovém trhu.

Jak byste popsali svou práci pětiletému dítěti?

David Hurych: Zvyšujeme bezpečnost aut, aby se méně bouralo, aby lidé méně umírali a aby si mohli v autě třeba i odpočinout.

Jakub Černý: Zlepšuji lidem práci, aby nemuseli dělat repetitivní činnosti a mohli dělat věci s větší přidanou hodnotou a zajímavější práci.

Můžete přiblížit, co pražské Valeo dělá v oblasti umělé inteligence?

DH: Jeden z příkladů využití AI je v našem Ground Truth Extraction týmu a zabývá se  zpracováním validačních dat, převážně k jejich anotaci, což je proces zahrnující popis obsahu nahrávek (poloha aut, chodců, popis manévrů apod). Na anotovaných validačních datech je spuštěn i vytvořený asistenční systém a jeho rozhodnutí jsou porovnána s anotací. Tak jsme schopni zvalidovat přesnost těchto systémů před nasazením do reálného provozu. Anotovaných validačních dat je potřeba opravdu hodně. Na 3. úroveň autonomního řízení už je potřeba asi 33 tisíc naježděných hodin s jedním systémem. A každá sekunda, každý snímek musí být anotovaný. Je to šílená práce, jde o miliardy obrázků.

K čemu tato validace slouží a proč je důležitá?

DH: Validace je důležitá, protože potřebujeme vědět, co systém udělá na velkém statistickém vzorku dat. 

Rozdíl oproti testování na dostupných datasetech používaných v akademickém prostředí je ten, že my musíme fungovat v reálném světě – v noci, v tunelu, za deště, venku, v Alpách, za mlhy. Jde o téměř neomezené množství možností, které nemůžeme všechny vidět a pokrýt. Validace je proto na tomto obrovském množství dat velmi důležitá, protože se snažíme zachytit co nejvíce různých možných situací, abychom zjistili, že celý systém funguje opravdu spolehlivě. Když to hodně zjednoduším, tak jde o to, aby se při každé možné příležitosti dalo předvídat, jak se automobil zachová. Nikdy sice nebudeme mít růžového nafukovacího slona před autem – protože to se nám nahrát prostě nepovede, pokud ho tam nepostavíme sami – ale snažíme se realisticky pokrýt co nejširší portfolio možností.

Pak jsou zde ještě další validace s předepsanými scénáři. Snažíte se zaparkovat směrem doprava – před vámi je auto, za vámi je chodec, co systém udělá? Scénáře jsou předepsané, takže v tomto případě nejde přímo o statistickou validaci, ale o příklady, které jsme vymysleli společně se zákazníky a dávají nám smysl.

Kolik je přibližně v automobilu snímačů?

DH: Liší se to. Každé auto má něco jiného i podle počtu systémů a výběru zákazníka. Extrémním příkladem může být náš prototyp Drive4U, proof of concept o postavení autonomního řízení 4. úrovně se sériově vyráběnými snímači. Ten má 6 LiDARů, 4 fish-eye kamery, 1 front kameru, 12 ultrazvukových senzorů a 4 radary. Dohromady je to přes 20 různých senzorů. Jde ale opravdu o proof of concept, výpočetní výkon zajišťuje samostatný výkonný počítač v kufru automobilu.

Samořiditelné systémy 3. úrovně jsou systémy podmíněné automatizace tzv. eyes off. V definovaném prostředí se řidič nemusí věnovat řízení, musí však být připraven převzít řízení v časovém limitu, který stanoví výrobce. V Evropě je 3. úroveň povolena pouze v Německu na přibližně 13 tisících kilometrech dálnic.

Vizualizace tzv. pointcloudu (mračna detekčních bodů) 3. generace Valeo LiDAR
Kdy myslíte, že se na silnicích objeví plnohodnotné samořiditelné systémy 3. úrovně?

DH: Samořiditelné systémy 3. úrovně na silnicích už jsou, pro specifické situace. Pro parkování, jízdu na dálnici a podobně. Level 3 systémy slouží vždy konkrétním účelům. Obecný systém 3. úrovně, který by pokryl všechny situace, zatím není.

Počítá s takovou situací například česká legislativa?

DH: Ta je, pokud vím, velmi pozadu. V USA jsou na tom lépe, česká legislativa zkrátka vůbec nestíhá. Jde o celoevropský problém, prostředí je tu hodně regulované.

Hrozí, že technologický vývoj půjde rychleji, než legislativní?

DH: Nehrozí, už tomu tak je.

Jaký je současný největší problém autonomních systémů, který zbývá vyřešit?

DH: Toho je strašně moc. Teď se například snažíme přesunout se od učení s učitelem směrem k učení bez učitele, abychom se mohli zbavit manuálního anotování. Je to hrozně drahé, náročné na pozornost a zároveň je to ubíjející práce. Jakmile manuální anotace nebudou potřeba, nebo budou potřeba jen minimálně, už k trénování AI stačí jen samotná  data. A i tady se snažíme objem snížit. Nejde o to data nemít, ale mít je například generovaná. Na redukci potřeby anotací používáme self-supervised metody učení, které si můžeme představit následovně. Vy učíte neuronovou síť, aby správně narovnala obrázek. Schválně ho třeba zrotujete, dáte jí měřítko a řeknete jí, ať ho narovná. Když se to učí na velkém množství dat, tak se naučí spoustu velmi užitečných příznaků i pro finální detekci lidí a aut. Pak jí stačí jen 10 anotovaných obrázků místo pěti milionů a adaptuje se na tu úlohu. To „maso“, zpracování obrazu, už se naučila a tudíž pozná určité příznaky i jinde. Pak tu máme různé semi-supervised metody, kdy je potřeba místo 100 % anotací například pouze 10 %.

Dále používáme modely, které se učí vzájemně, například teacher-student. My se tedy ve výsledku snažíme nemít anotace a snažíme se zredukovat potřebu skutečných dat. Už teď jsme schopni generovat data docela dobře, ale je to tak trochu problém typu, co bylo dřív slepice nebo vejce? Když chcete data generovat, tak potřebujete data, abyste generátor dat něco naučili. Snažíme se ukrajovat procenta těch reálných datových sad tak, abychom je mohli doplnit virtuálními daty. Ve zpracování textu se self-supervised learning také používá. Zakrývají se například slovíčka ve větě a neuronová síť se je snaží sama doplnit. Přestože finální úlohou je něco jiného, třeba klasifikace textových dat v tabulce, tak potřebné úlohy se model naučí self-supervised metodou, a pak se jen „ohne“ na finální úlohu s minimem dat anotovaných. Vše to spěje k tomu, aby se modely učily co možná nejvíce samy, a jen se jim předkládaly velké hromady dat.

Dat tedy máte dostatek?

DH: Veskrze ano. Ve výzkumu se typicky pracuje s data sety. Co my tu máme, tomu já říkám hromady dat. Z hromady dat udělat data set, je výzva sama o sobě. V automobilovém průmyslu není problém v tom, že by data nebyla, ale naopak spíš v tom, že je nestíháme zpracovávat. V rámci úlohy nebo projektu to zvládneme. Jenže kdybychom z nich chtěli těžit dál, narážíme už na problém s kapacitou výpočetní síly. Nedávno se nám podařilo zajistit si tříletý přístup k superpočítači v rámci jednoho evropského projektu, což nám trochu uleví.

JČ: U nás ve výrobě je problém trochu jiný. Data máme, ale občas potřebujeme například detekovat defekty na výrobku, který se objeví třeba jednou za 14 dní. Je z toho pak jen několik obrázků a s tím se dál špatně pracuje.

Bezpečnostní standardy se zlepšují a časem se změní i mindset lidí. Bude to kombinace důvěry a prostředků. Aktuální nedůvěru vnímám. Když vím, že může kdykoliv nastat nenadálá událost – a já netuším, jak ten systém zareaguje – je to problém. Přesně to se snažíme zlepšovat.

U veřejnosti člověk často narazí na nedůvěru vůči samořiditelným automobilům, neochotu přenechat řízení stroji. Vnímáte stejný problém a myslíte si, že se časem veřejné mínění změní?

DH: Ano, vnímám to stejně, ale časem se to určitě změní. Je to o mindsetu. Abyste sedli do autonomního auta, tak to auto musí mít ne takovou přesnost a nehodovost jako vy, ale musí být mnohem lepší. Musíte systému opravdu důvěřovat, abyste si v autě klidně i zdřímli. Je to o důvěře, a je to o validní statistice. Potřebujete mít systém opravdu otestovaný, máte redundantní systémy řešící stejnou úlohu paralelně a kontrolující se navzájem. 

Bezpečnostní standardy se zlepšují a časem se musíme dostat do fáze, kdy se mindset lidí změní a kdy si řeknou, že už se jim to vyplatí. Uvidí extrémně nízkou nehodovost a začne se jim nákup vyplácet i finančně. Bude to kombinace důvěry a prostředků. Aktuální nedůvěru vnímám a svým způsobem ji mám také. Vím, co čekat od člověka, ale nevím, co od systému. A ještě k tomu když vím, že může kdykoliv nastat nenadálá událost – a já netuším, jak ten systém zareaguje – tak je to problém. Přesně to se snažíme zlepšovat, generovat data, vyzkoušet maximum možných situací, které se kdy mohou objevit. 

V jednu chvíli přijde změna. Možná spolu se změnou generace s mladými lidmi, kteří už třeba řidičáky ani nebudou chtít bude jednodušší autonomní systémy přijmout. Ale to už spekuluji.

Jaká je podle vás budoucnost autonomního řízení? Více gentlemanská, bude na silnicích větší řád? Co můžeme čekat?

JČ: Podle mě to může být efektivnější než teď, když se tady podíváte na silnice… Mě třeba vadí, že auta nekomunikují s křižovatkou. Mluvím o situaci, kdy dojedete na křižovatku, zastavíte na červenou, ale nikdo v protisměru nejede. Návrhy takového řešení, dokonce i konkrétní řešení již existují. Můj profesor automatizace, pan Vavřín, rád říkal, že dokud toto nebude autonomní, tak se bude bourat.

DH: Já souhlasím, i když bourat se bude vždycky. Když se ale automobilky domluví a standardizují vehicle-to-vehicle komunikaci, situace na silnicích se zlepší. Ubyde kolon, protože se optimalizuje rychlost, a přeprava bude plynulejší. Statisticky bude nehodovost autonomních systémů samozřejmě mnohem nižší, než lidská. Někdy se nehoda jistě stane řekněme, že by systém narazil třeba na led v Káhiře, s tím se prostě počítat nedá ale myslím, že ta budoucnost je rozhodně pozitivní. Trochu negativní je možná v tom, že lidé zase o trochu zleniví, nebudou už umět ani řídit a zase bude o dovednost méně.

Čím vy osobně jezdíte, pokud jezdíte autem?

JČ: Já se snažím do práce běhat, ale jinak mám Hyundai i30.

DH: Já se snažím jezdit do práce na kole. Ještě před rokem jsem jezdil s Felicií Combi z roku 1998, teď mám Superba, ale v podstatě v základu bez výbavy. Ocenil bych parkovací systémy, senzory a tak dále a nejspíš si je časem přikoupím ale štve mě lane keeping a podobně, co vám do řízení trošku sahá, navíc často ne úplně optimálně. Je totiž strašně těžké to nastavit tak, aby se to přizpůsobilo každému jednotlivému řidiči. Každý řídí trochu jinak. Když systém nastavíte na „průměrného“ řidiče, tak prostě moc dobře nefunguje. Už tu jsou systémy, které se adaptují na konkrétní styl řidiče. Systém zpočátku sleduje, jak řídíte, a postupně se přizpůsobí. Učí se být i agresivnější když třeba potřebujete odbočit doleva, je tam kolona a nikdo vás nechce pustit. Když řídí člověk, začne se do provozu trochu tlačit. Ty systémy už to teď dělají také, protože jinak by se nepohly z místa.

Kde ve světě vidíte hlavní technologické huby vašeho oboru?

DH: V autonomním řízení je dobrá Čína, hodně to tam tlačí a hlavně mohou jednoduše dát „rozkaz shora“. Evropa je velmi regulovaná, trošku pomalejší, i když kvalita je možná o něco vyšší. Přijde mi, že to sem zkrátka jen přijde se zpožděním a doufejme, že ve vyšší kvalitě.

JČ: Když se podívám na pobočky Valea, vede pro mě Německo. V Německu mají vyloženě Advanced Technology oddělení a dělají tam opravdu zajímavé věci. Za mě jsou napřed a co jsem pochopil, tak je to i docela štědře podporováno německou, respektive v tomto případě bavorskou, vládou. Tam si myslím, že je podhoubí, aby se přiblížili tzv. Průmyslu 4.0, který je velkou mantrou, ale realita je trošku někde jinde.

Je pro vás umělá inteligence spíše hrozba nebo se těšíte na její vývoj?

DH: Já moc nechápu všechno to strašení. Rozumím, že kdyby se generátor jako GPT 4 dostal do rukou někomu nepovolanému, tak by s tím byl schopný velmi efektivně generovat spoustu fake news. Nicméně, kdybych měl z něčeho strach, tak právě z těchto textových generátorů, které mohou zahltit internet relativně dobře vymyšleným balastem. Ale jinak bych se vývoje vůbec nebál. Neuronka nebo umělá inteligence udělá přesně co jí řeknete a na co jí naučíte. Nemá vlastní agendu ani hlavu, potřebuje silný hardware a spoustu péče, je křehká. Od Skynetu jsme opravdu hodně daleko, kde ale vidím urgentní potřebu je paralelní vývoj fact-checkingu a fake news detection systémů, které umožní běžným lidem zhodnotit validitu informace, kterou čtou nebo sledují na videu, aby nebyli snadno zmanipulovatelní.

Můj sen je, že na každé webovce najdeme neuronovou síť nebo umělou inteligenci, jejíž kód bude známý a otevřený, budeme znát trénovací data a každý se na to bude moct podívat. Na každé webové stránce pak bude banner, který řekne: Na tomto webu je tolik a tolik procent informací fakticky správných, čímž vznikne fact checking pro každého. Věřím, že třeba 85 % informací je naprosto neověřitelných, že jde jen o názory. Na tohle bych tlačil, aby fact-checking věcí byl zdarma, ale aby byl také otevřený a každý viděl, jak to funguje. Jinak si myslím, že jsme strašně daleko od něčeho nebezpečného, protože paralelně s nebezpečnými variantami využití AI budou vznikat i protiopatření.

JČ: Je to nástroj jako každý jiný. Můžete ho použít k páchání dobra i zla. Mám rád větu Artificial intelligence is no match for natural stupidity (Umělá inteligence se nemůže rovnat přirozené hlouposti.). A to pořád platí.

Občas zaznívá názor, a to i mezi odbornější veřejností, že by AI mohla mít podobné důsledky jako první průmyslová revoluce. Chaos, spousta lidí přijde o práci, nebudou se umět přizpůsobit. Jak to vidíte vy?

DH: Ono to opravdu strašně moc míst zavře, ale také jich to strašně moc vygeneruje. Vidím teď hodně nových míst, třeba učitelé neuronových sítí. Budou anotovat data a tím přiučovat neuronovou síť. Změna určitě přijde, to je pravda, ale důvod pro paniku nevidím, naopak je to příležitost dělat věci efektivněji a AI vidím jako pomocníka

JČ: Naprosto souhlasím. Vidíme to i v praxi. Chodíme do výroben, kde jsme sebrali práci pro půl operátora. Jenže jsme přidali pro další dva novou. Jak říkal kolega, musí tam být někdo jiný, obvykle vzdělanější člověk, a anotovat ta data. Musí vědět, co dělá. Když udělá chybu, hrozí větší průšvih, než kdyby za normálních okolností vyrobil jen jednu špatnou součástku. A rozhodně nemůžeme nahradit operátory do roka nebo do dvou jde o běh na dlouhou trať.

DH: Jednoho dne možná operátor nebude potřeba, ale ten přechod nebude skokový, potrvá to roky.

Generativní adverzní síť (Generative Adversarial Network, GAN) je model strojového učení (ML), ve kterém dvě neuronové sítě mezi sebou soutěží pomocí metod hlubokého učení, aby byly jejich předpovědi přesnější.

Jakým způsobem využíváte ve Valeo GAN při práci?

DH: Valeo využívá GAN dvojím způsobem. 

Představte si obrázek, kde je místo auta modrý flek s přesnou konturou auta. Vedle toho je zelený flek – strom. Jde o sémantickou mapu, která říká, na kterém místě má být co za třídu. Toto je pixelová třída auto, toto je třída strom. Sémantickou mapu si můžete vygenerovat snadno. To máme na vstupu a dokážeme z toho s pomocí neuronové sítě získat reálný obrázek. Postavíme si scénu a s určitou kvalitou z toho dostaneme obrázek. Můžeme si tak postavit scénu, kde člověk stojí na autě a podobně. Není to dokonalé, ale taková generovaná data v učení hrozně pomáhají. Pracujeme na tom, abychom tato data mohli generovat do testování a systémové validace. To je náročnější, protože tam nesmíme mít artefakty. Jde i o kvalitu obrazu, navíc scéna nesmí být moc daleko od reality. 

Druhé využití GANů, které využíváme je např. zakreslování lidí. Vstupní obrázek je nějaká scéna, a my si řekneme, že tam chceme zakreslit člověka v dané poloze. Vybereme si polohu a ono ho to tam zakreslí. Dá se říct, že jsme schopni si rozšířit sadu obrázků s lidmi. Díky tomu máme automatickou anotaci. Víme, kde ten člověk je a můžeme na tom modely dál učit. Tím, že si do různých scén generujeme lidí, si můžeme zkvalitnit jejich detekci pro automobil. Velmi specificky to pomohlo ve městech v nočních scénách, kde jsme dosáhli daleko lepší přesnosti detekce. Toto je jen jeden z příkladů využití GANů.

David Hurych je ve Valeu už 10 let. Před nástupem do firmy studoval doktorát na katedře kybernetiky ČVUT obor biokybernetika a umělá inteligence. Ve firmě pracoval zpočátku jako Research Engineer a SW Team Leader, kdy měl za úkol se svým týmem učit neuronové sítě a další AI modely pro nasazení v automobilu. 

Poslední 4 roky je na pozici Research Scientist v týmu Valeo AI. Ten majoritně sídlí v Paříži, celkem má přes 20 členů, z toho dva v Praze. Věnuje se výzkumu a publikační činnosti kolem nejmodernějších hlubokých neuronových sítí. David má zároveň na starosti supervising Ph.D. studentů.

Jakub Černý ve Valeu působí čtyři roky. Nastoupil do nově otevřeného oddělení, které se zabývá industrializací. Úkolem oddělení je propojovat R&D a výrobní sekce společnosti. Zaměřují se na aplikaci AI technologií pro industrializaci přímo ve výrobních linkách. 

Vystudoval VUT v Brně, konkrétně Kybernetiku a měřící systémy, se specializací na zpracování obrazu. Ve Valeu pomáhá celému týmu tvořit a nasazovat AI modely do praxe.

Podívejte se na zkušební jízdu předváděcího vozu Valeo v centru Paříže.