Според актуално проучване на Масачузетския технологичен институт анализът на масиви данни от операторите на мобилни телефонни услуги може да даде информация за риска от възникване на грипни епидемии. Обикновено корпорациите използват своите масиви от данни за потребителите за маркетингови цели и за да поддържат конкурентоспособността си. Не може да не сте чували за компанията, която открила, че потребителите, които купуват памперси, обикновено купуват и бира.
През последните няколко години обаче все повече се говори за дарителство на данни.
От отворени данни към големи данни
Идеята за т.нар. отворени данни е сред най-актуалните концепции в публичното управление. Според тази концепция определени данни би трябвало да бъдат на разположението на всеки за свободна употреба, включително за търговски цели и без ограничения за авторски права, патенти или други начини за контрол. Целите на движението за отворени данни са подобни на другите отворени течения като отворен „изходен код“, „отворено съдържание“ или „отворен достъп“.
Понятието отворени данни придобива актуалното си значение с развитието на Интернет мрежата. Според един скорошен доклад на МакКинзи, само в 7 отделни икономически сектора (сред тях са образование, транспорт, нефт и газ, здравеопазване) отворените данни имат потенциал да генерират поне 3 трилиона долара годишна печалба, ако бъдат използвани ефективно. Защо? Защото създават условия за прозрачност и показват алтернативни възможности – а така засилват конкуренцията.
Публичните институции в България нямат опит в сферата на отворените данни. Добре известно е, че повечето достъпни за обществеността данни и документи традиционно се публикуват в неудобен за машинно четене формат като сканирани снимкови формати или pdf-файлове например.
Българските граждански организации обаче стават все по-активни на тема отворени данни. Неотдавна Общество.бг стартираха проекта „Демонстрационен портал за отворени данни”, съвместно с Министерски съвет, чиято идея е да се превърне в централно място, където институции ще публикуват събраната от тях информация в удобен вид за анализ – преработка, показване на карта, диаграма, или под друга различна и по-разбираема форма. Порталът има потенциал да се превърне в централизиран каталог, предоставящ публични данни в удобен за автоматична обработка и машинно-четим формат.
Отвореният достъп до големи масиви от данни доведе до появата на концепцията за употребата на големите данни за публични цели. „Големи данни“ е термин, с който най-общо се означават бази данни, които са толкова големи или сложни, че тяхната обработка не се поддава на използването на традиционни програми и методи. Предизвикателствата, свързани с големите данни, са от гледна точка на техния анализ, търсене, организиране, споделяне, съхранение, трансфер, визуализация. Не без значение е и въпросът за сигурността на личната информация.
Големите данни предоставят изключителна възможност да се отговори на проблеми и предизвикателства, които са сложни, големи по обем и се развиват бързо във времето. По отношение на публичния сектор, най-големият принос на големите данни е в развитието на политики, базирани на опита на потребителите и реалните свидетелства и информация. Тук е и пресечната точка с т.нар. human centered design. Разработване и прилагане на политики и услуги, фокусирани върху опита и очакванията на потребителите. Големите данни съвсем не са виртуална идея. За повечето сериозни компании те са реален начин за правене на бизнес.
Няма такова нещо като твърде много информация.
Целите на анализа на големи данни могат да бъдат най-разнообразни: управление на комплексни технологични процеси, поддръжка на системи, мениджмънт на интернет трафика, повишаване качеството на определена услуга, увеличаване приходите от продажби чрез идентифициране на точния момент за поява на даден продукт на пазара. Големите данни могат да служат за съставяне на потребителски профили, болнични досиета, установяване на връзки между отделни лица, установяване на самоличности и прочие… В последните години се създаде и стабилизира значителен пазар за големи данни – и пазар на услугите, свързани с тях. Големите данни са възможност за голям бизнес.
От големи данни към филантропия на данни.
Наред с отворените данни и големите данни, през последните няколко години постепенно навлиза т.нар. корпоративно дарителство на данни. Това е форма на виртуална филантропия, на дарителство тип 2.0, свързано с новите модели на публично управление и гражданско участие, основани на информационните масиви от данни. В дигиталния свят на XXI век всеки от нас ежедневно произвежда огромен масив от данни. Голяма част от тези данни са на свободно разположение в интернет – блогове, коментари, фейсбук или туитър активности. Друга част обаче не е свободно достъпна. Това е т.нар. информационен боклук, страничен информационен продукт, който различни корпорации събират, анализират и „разорават“, за да получат – в реално време – информация за предпочитанията на техните клиенти.
Компаниите обаче биха могли да предоставят тези масиви от данни за публични цели. Такова корпоративно дарителство на данни ще повиши значително капацитета на публичния сектор да предвижда и да реагира на кризи като икономически и финансови трусове, епидемии или природни бедствия. Например изследователи от Швеция и САЩ използват данни от най-големия мобилен оператор на Хаити, за да определят траекториите на движение на мигриращото население след земетресението през 2010, като по този начин подпомагат разпределението на хуманитарна помощ и ресурси.
Публичните институции са в позицията на догонващи по отношение на полезната употреба на данни за обществено значими цели. Например онези служби, които генерират най-значими от социална гледна точка големи данни (училища, болници, социални служби) нямат капацитет да ги управляват адекватно. За разлика от търговските организации, които го правят умело и печелят от това.
Ако искате да научите повече по темата:
Подсайт към Харвардския университет за ползите и предизвикателствата пред публичното управление, основано на данни: http://datasmart.ash.harvard.edu/civic-data
Корпоративната страница на SAS, водеща компания в сферата на бизнес анализа ще ви запознае с основните понятия в света на данните: http://www.sas.com/en_us/insights/big-data.html
Екипът за социологически изследвания OpenData към Институт „Отворено общество“ предоставя данните си за безплатно ползване на адрес: http://www.opendata.bg