Hlavní navigace

Google otevřel nástroj pro rozpoznávání objektů na obrázcích

Roman Bořánek

Výzkumníci z Google Brain zveřejnili zdrojové kódy nástroje im2txt, který dokáže rozeznat objekty na obrázcích. A to i včetně vztahů více objektů a jejich činností. Nástroj je vlastně modulem pro platformu TensorFlow zaměřenou na strojové učení. Současně se im2txt dočkal několika změn, např. dalšího zvýšení přesnosti. Dnes správně rozezná téměř 94 % obrázků.

Projekt je v současnosti určen hlavně pro výzkumníky, není připraven pro snadné nasazení v praxi. Podobná řešení už se ale v praxi začínají využívat. Např. Facebook se takto snaží popisovat obrázky nevidomým. Všechny potřebné materiály k im2txt naleznete na GitHubu.

Našli jste v článku chybu?