В началото на ноември 2021 година Световната банка стартира проект за "Въвеждане на Data Lakehouse" архитектура, който цели да имплементира иновативни решения в областта на анализите и работата с данни в структурата на организацията. В основата на проекта стои Центърът за споделени услуги на групата на Световната банка в София, основан през 2019 година.
Визитка на ИТ проекта
Име на проекта: Въвеждане на Data LakehouseВъзложител: Световната банка
Изпълнител: Световната банка
Дата на стартиране/приключване на проекта: 1.11.2021 г./30.12.2022 г.
Проектът е кандидат в конкурса Digitalk&A1 Awards
Категория: Внедрено в предприятие ИТ решение
Целите
Целта на проекта е да модернизира текущите системи и методи за обработка, събиране, съхранение и разпространение на данни, както и да предостави устойчива среда за стабилно бъдещо развитие на технологичните услуги на организацията, обясняват от Световната банка.
Фокус на имплементацията е обработката на данни да се извършва от единен, лесно проследим и лесно одитируем процес в сравнение с използването на стотици отделни процеси преди започването на интеграцията. Новото решение има за цел да намали времето за:
- Разрешаване на проблеми, свързани с обработката и зареждането на данни;
- Добавяне и миграция на нови данни от външни или вътрешни за банката източници към основното хранилище на данни;
- Отстраняване на грешки и проблеми с разработките.
Като допълнителни ползи, платформата цели да постигне:
- Намаляване на оперативните разходи чрез премахването и/или консолидирането на множеството процеси и системи за зареждане и обработка, бази и хранилища на данни;
- Среда, позволяваща бърза и структурирана имплементация на бъдещи аналитични модели в областта на изкуствения интелект, с фокус върху извличането на знания и намаляване на времето за доставяне на услуги до служителите и клиентите на организацията.
Изпълнителят
Центърът за споделени услуги е създаден с фокус върху звеното за информационни технологии, като впоследствие се разпростира и върху други аспекти на бизнеса като финансови операции, покупки и др. Звеното по информационни технологии на Световната банка в София разполага с екипи от висококвалифицирани специалисти в областта на работа с данни, облачни платформи, мрежова инфраструктура, услуги за поддръжка, инженеринг, изкуствен интелект и машинно обучение. В момента в столицата работят екипи върху развитието на модерни платформи за данни и дигитална стратегия за разработка на софтуерни системи и приложения; екипи за разработване на дизайн; екипи, занимаващи се с разработване на модели за машинно обучение, изкуствен интелект и геопространствени анализи; както и екипи, занимаващи се с основните дейности по поддръжката на ИТ системи.
Проектът
Проектът за "Въвеждане на Data Lakehouse" архитектура до момента обхваща миграция на 200+ бази данни в приблизителен размер от 1TB. Чрез платформата е осъществено преместването на основните корпоративни данни на организацията. Всички вътрешнооперативни справки са модернизирани и оптимизирани с цел по-добра приемственост от крайните потребители. В процеса на разработка стриктно се прилагат Agile методите, които подпомагат поетапното доставяне на очакваните резултати в срок.
Екипът Data Platforms, който е базиран в София, има водеща роля при дефинирането на модерната Data Lakehouse платформа, в тясно сътрудничество с колегите си от екипа на Data Engineering и други глобално разпределени екипи като Data Analytics, Data Governance and Privacy. Съвместно те разработват преизползваем и стандартизиран модел за зареждане и обработка на голямо количество данни. Използвани са най-модерните архитектурни принципи и практики в тази област и новата архитектура Lakehouse. Като част от въвеждането на решението в експлоатация е изработена стратегия за пълна и автоматизирана проследимост на данните (Data Lineage), обработката им в реално време и имплементацията на допълнителни DevOps, DataOps и Data Privacy процеси.
Предизвикателствата
Предизвикателствата, с които от организацията се сблъскват при имплементирането на проекта, са обусловени от мащаба и сложността на дейността на банката и постоянния стремеж за въвеждане на иновативни технологии и модели на работа за постигане на висока оперативна ефективност. "Сложността идва от факта, че банката работи с една от най-големите колекции от икономически данни в света, включваща над 500 милиона публични гледания и изтегляния", коментират от организацията. Разнообразието от умения и креативност на хората и екипната им работа позволява да се справят с тези предизвикателства, като прилагат най-новите технологични решения.
Първото голямо предизвикателство, пред което се изправя екипът, е миграцията на данни от стари (legacy) системи с често липсваща техническа и бизнес документация. Това предизвикателство е решено чрез подробно събиране на съществуващите изисквания и анализиране на нужди на организацията.
Второто предизвикателство е интеграцията на изцяло нов модел на работа в организация с традиции в областта, каквато е Световната банка. Тук екипът решава проблема с организиране на редица технологични дискусии и демонстрации.
Въздействие и бъдещо развитие
"Чрез този проект се отварят възможности за развитие на услугите, свързани с работата с данни и въвеждане на други иновативни методи за анализ на данни в бъдеще. Тези услуги, както и самите данни, са ключов актив и инструмент, който спомага за постигането на амбициозната и отговорна мисия на Световната банка, а именно прекратяване на крайната бедност и насърчаване на споделения просперитет", обясняват от Световната банка
Част от дейността на организацията е фокусирана върху оказването на анализаторски и консултантски услуги, от които се нуждаят развиващите се страни. Банката се занимава с изследователска работа по широк кръг от въпроси като околната среда, бедността, търговията и глобализацията, икономическите и отрасловите изследвания в конкретни сектори. Тя анализира перспективите за икономическото развитие на страните, в това число банковия и/или финансов сектор, търговията, проблемите на бедността и системата за социална защита.
"Всички тези дейности превръщат банката в организация, богата на данни (data rich), и същевременно я изправят пред предизвикателството да може да работи оптимално с тези данни. Проектът поставя основата на среда, в която данните да могат да бъдат организирани по-бързо от преди, и също да позволява лесно свързване на различните данни така, че вместо да се виждат отделните елементи, да се вижда ясно цялото. Тази нова среда също дава възможност по-лесно да бъдат прилагани технологии за анализ, базирани на изкуствения интелект и машинното обучение, и да бъдат извличани знания и информация в близко до реално време, а това от своя страна дава възможност да се реагира по-бързо на възникващите кризи и да бъдат взети навременни и информирани решения в спешни ситуации", разказват от Световната банка.
В началото на ноември 2021 година Световната банка стартира проект за "Въвеждане на Data Lakehouse" архитектура, който цели да имплементира иновативни решения в областта на анализите и работата с данни в структурата на организацията. В основата на проекта стои Центърът за споделени услуги на групата на Световната банка в София, основан през 2019 година.
Визитка на ИТ проекта
Име на проекта: Въвеждане на Data LakehouseВъзложител: Световната банка
Изпълнител: Световната банка
Дата на стартиране/приключване на проекта: 1.11.2021 г./30.12.2022 г.
Проектът е кандидат в конкурса Digitalk&A1 Awards
Категория: Внедрено в предприятие ИТ решение