Популярният производител на пици стъпва в развиващата се област на MLOps, за да обновява моделите с данни и да ги пуска в производство без помощта на ИТ специалистите
Клинт Баултън, CIO
Като всяка голяма марка Domino's Pizza разчита силно на данните, за да подобри обслужването на клиентите си. Но екипът на науката за данни в световния номер 1 в производството на пици използва тайна съставка, за да подобри вземането на решения - платформа за машинно обучение (ML), която му помага да предостави модели в производство по-бързо.
Екипът използва платформата, за да изпълнява, усъвършенства и валидира множество ML и AI модели, като в същото време намалява зависимостта си от ИТ за изчислителни ресурси, което в исторически план е било проблемна точка, споделя Зак Фрагозо, мениджър на наука за данните и изкуствен интелект в Domino's.
"Хората обичат пица и ние обработваме много поръчки, казва Фрагозо. Липсващото парче от пъзела беше начин да въведем модели в производство."
Използването на анализ за бизнес познание е достатъчно трудно само по себе си, но специалистите в сферата на науката за данните трябва също така да се борят със закъснения в осигуряването на всичко - от сървъри до среди за разработване на софтуер от ИТ. Такива закъснения създават проблеми за екипите, които създават модели с данни, чувствителни на времето, за да подобрят вземането на решения и да постигнат желания бизнес резултат, казва Фрагозо.
Пътешествието на Domino's към MLOps
Domino's, чиито годишни продажби възлизат на 14 милиарда щатски долара, намали частично това затруднение, като се облегна на петгодишната стартираща компания Datatron. Тя се конкурира с DataRobot, Google и други в създаването на платформи, които помагат на компании да направят работещи ML модели, познати още като MLOps.
Когато през 2017 г. Фрагозо се присъединява като служител №7 към екипа, работещ в сферата на науката за данните, Domino's изпълнява модели за своята система за електронна търговия по традиционния начин. Екипът трябва да чака за дневни извлечения на данни от магазините на Domino's, за да обучи отново модел, а след това да заяви към ИТ ресурсите за изпълнение на обновените с най-актуалните данни модели. Но дори това относително кратко от 24- до 48-часово забавяне от модел до производство пречи на точността на данните.
"Ние бяхме с вързани ръце, спомня си Фрагозо. Имаше много повече допирни точки и отнемащи време актуализации, които не трябваше да бъдат там."
Днес екипът се гордее с 63 членове, които разполагат, изпълняват и прекалибрират ML модели със софтуер за оркестрация на контейнери на Datatron и Kubernetes, използващи частния облак на Domino's. Способностите за виртуализация на софтуера помагат на екипа да разбере как се променят прогнозите за преживяването на клиентите и дейностите на магазините с течение на времето и им дава възможност да обновяват тези модели на базата на нови данни, казва Фрагозо.
Например Datatron позволява на екипа да изпълняват A/B тестове, в които насочва малко количество от трафика в уебсайта В, за да валидира новите модели. Всичко това се случва, без да се влияе върху работата на екипа по електронна търговия или на магазините. "Ние непрекъснато подобряваме, разработваме и актуализираме модели, когато идват нови данни", казва Фрагозо.
В крайна сметка работата на екипа за науката за данни с Datatron помага да се подобри съставянето на смените на персонала чрез прогнозиране на изискванията от наличие на служители за всеки магазин, да се оптимизират маршрутите на автомобилите за доставка и да се намерят места за построяване на нови магазини наред с други цели. Освен това благодарение на промените Domino's следи за отклонение на моделите на данните, което заради динамиката често се появява в дейностите на магазините. "Ако се промени някоя цена, моделите трябва да бъдат актуализирани, за да отразят новата реалност", казва Фрагозо.
Внедряването на най-новите сложни технологии може обаче да бъде доста напрегнато за отделните специалисти и в тази връзка е необходимо да се положат усилия в посока управление на промените. Подобни трудности възникват и с Datatron в Domino's, където традиционно ИТ са силно замесени в производствените усилия на екипа за науката за данните. Но сериозните резултати помогнаха на екипа за наука за данните да пресече "здравословното опасение", казва Фрагозо.
"Това беше печеливша ситуация и за двата екипа, казва Фрагозо. Екипът за науката за данните беше много по-ангажиран, докато ИТ специалистите не бяха принудени да отделят ресурси за заявки от нас."
Борбата на MLОps е истинска
Екипът за науката за данните в Domino's не е единственият, който се сблъсква с предизвикателства при изграждането на модели и изпълнението им. До 2023 г. 50% от ИТ ръководителите ще изпитват затруднения да преместят своите прогнозни проекти от етапа на доказване на концепцията към производството заради технологични пречки, лошо качество на данните и други бъркотии, разкрива изследване на Gartner през 2020 г. Междуведомствените политики също мътят водата, изисквайки силно сътрудничество между учените за данни, експертите по изходни системи, системните архитекти, разработчиците на приложения и други специалисти.
Докато много учени в сферата на данните имат различно образование и експертиза, включително статистика, физика и други дисциплини, мнозинството от тях нямат опит в компютърни науки или програмиране, да не говорим за способността да работят със софтуерна инфраструктура и процеси, които биха им позволили да разширяват техните модели, казва Хариш Доди, главен изпълнителен директор на Datatron.
И обратното, повечето инфраструктурни инженери нямат опита в изграждането на модели от данни, поради което е необходимо сътрудничество и договаряне между експертите в областта на науката за данните и на ИТ, казва Доди, който е забелязал такива пропуски в знанията, докато е работил като софтуерен инженер в Lyft, Snap и Twitter, преди да основе Datatron.
В типичния цикъл на живот на AI модел учените в областта на данните разработват модели и ги предават на инфраструктурните инженери, които ги пускат в производство. Софтуерът на Datatron автоматизира голяма част от технологичното блокиране и справяне, което екипите за науката за данните извършват, за да изпълняват SAS, R, ML и регресивни модели. Освен това той помага да се наблюдават моделите в производство, да се управляват, за да не се получава "отклонение", при което възможностите за прогнозиране намаляват при промени в данните.
"Моделите с изкуствен интелект са продуктивни само ако се справят в производството", казва Доди.
MLOps могат да помогнат на учените в сферата на данните да построят този мост.
Превод и редакция Мариана Апостолова
Материалът е публикуван в бр. 5 на сп. CIO България, който може да откриете тук.
Популярният производител на пици стъпва в развиващата се област на MLOps, за да обновява моделите с данни и да ги пуска в производство без помощта на ИТ специалистите
Клинт Баултън, CIO