Рус телле даирәдә Big Data термины да, «күләмле мәгълүмат» төшенчәсе дә кулланыла. «Күләмле мәгълүмат» термины – инглиз телендәге терминның калькасы. Күләмле мәгълүматның төгәл билгеләмәсе юк. Аларны 10 террабайт яисә 10 мегабайт дип атап, ачык чик үткәреп булмый. Атама үзе үк бик субъектив. «Зур» сүзе борынгы кабиләләренең «бер, ике, күп» төшенчәләренә тиңдәш.
Әмма күләмле мәгълүмат — өч операция башкару өчен кирәкле технологиялэр җыелмасы дигән тотрыклы фикер бар. Беренчедән, алар «стандарт» сценарий белән чагыштырганда, зуррак күләмдәге мәгълүматны эшкәртергә тиеш. Икенчедән, зур күләмдәге тиз керүче мәгълүмат белән эшли белү. Ягъни, мәгълүмат күп кенә түгел, ә кыска вакыт эчендә аның күләме үсеп тә тора. Өченчедән, алар структуралаштырылган hәм структуралаштырылмаган мәгълүмат белән төрле аспектларда параллель эшләргә тиеш. Күләмле мәгълүмат дигәндә, без алгоритмнар белән эшкәртелү өчен килә торган мәгълүматның кайчагында структуралаштырылмаган булуын һәм аннан бердән артык идея алып булуын күздә тотабыз.
Күләмле мәгълүматның гадәти мисалы ─ ул төрле физик тәҗрибә җайланмаларыннан, мәсәлән күп күләмдә мәгълүмат җитештерә торган Зур адрон коллайдерыннан (Зур адрон бәрдергече) килгән мәгълүмат. Бу җайланма даими рәвештә төрле күләмдә мәгълүмат туплап, чыгарып тора, ә галимнәр алар ярдәмендә берьюлы шактый күп санда мәсьәләләр чишәләр.
Күләмле мәгълүматның иҗтимагый киңлеккә чыгуы аларның мондый мәсьәләләр өстендә эшли торган фәнни берләшмәләргә генә түгел, ә барлык диярлек кешеләргә дә кагылуы белән бәйле. Big Data технологияләре конкрет бер сан – Җир йөзендә яшәүчеләр саны турында сүз чыккач, иҗтимагый кулланылышка керде. Социаль челтәр һәм башка проектларда утыра торган 7 миллиард кеше. YouTube, Facebook, ВКонтактеда кешеләр саны миллиардлар белән исәпләнә, ә алар башкарган операцияләр ─ хисапсыз. Бу очракта мәгълүмат агымы ─ ул кулланучыларның хәрәкәтләре. Мәсәлән, шул ук YouTube хостингының челтәр буенча ике якка да тарала торган мәгълүматы. Эшкәртү астында интерпретация генә түгел, ә һәрбер хәрәкәтне дөрес итеп эшкәртү мөмкинлеге, ягъни аны кирәкле урынга урнаштыру күз алдында тотыла. Һәм әлеге хәрәкәтләр барлык кулланучылар өчен дә тиз арада куллана алырдай булырга тиеш, чөнки социаль челтәрләр көттерүне яратмый.
Зур күләмдәге мәгълүматны анализлау юлларының күбесе инде күптәннән барлыкка килгән. Мәсәлән күзәтү камералары төшергән сурәтләрнең эшкәртелүе. Яки роботларның навигациясе. Аларның килеп чыгуына инде якынча 10 ел булуга карамастан, ул бүгенге көндә кенә киң җәелеш тапты, чөнки бу өлкәдә хезмәт иткән кешеләрнең саны артканнан арта
Күпчелек белгечләр статистик объектлар белән генә эшләргә өйрәнгән. Ә зур күләмле мәгълүматны эшкәртү ысуллары чак кына аерыла. Син иге-чиге булмаган мәгълүмат агымы белән эшли белергә тиеш. Бу гадәти булмаган мәсьәлә зурдан зур тармакларны күз алдында тота.
Тормышыбызда зур күләмле мәгълүматны эшкәртә торган аппаратларның да саны арта, мәсәлән, «әйберләр интернеты».
Полиция хезмәткәрләренең «Ташкын» («Поток») системасы да бөтен камераларда булган мәгълүматны карап, номерлар аша кирәк машиналарны табарга булыша. Ә фитнес-беләзек, GPS-трекер кебек җайланмалар кешеләрнең кайбер мәшәкатьләрен үз өстенә ала.
Кешеләр турында күпкырлы (ягъни һәр кеше, кешеләр төркеме турында күптөрле үзенчәлекләрдән чыгып статистика тупланган) статистика бик күп җыелып бару сәбәпле, Мәскәүнең мәгълүматлаштыру департаменты мәгълүмат аналитикларын күпләп эшкә җыя. Бу мәгълүматдан файдаланып канунчалыклар һәм тенденцияләр табырга кирәк. Мондый эшне башкарыр өчен IT-белемле математикларны эшкә алу зарур, чөнки, ахыр чиктә, бөтен мәгълүмат структуралы МБИСларда (мәгълүмат базасы белән идарә итү системасы) саклана, һәм аларга мөрәҗәгать итеп мәгълүмат ала белергә кирәк.
Моңарчы без күләмле мәгълүматны мәсьәлә итеп тикшерә алмый идек. Моның сәбәбе бик гади – мәгълүматны саклар өчен урын һәм аларны алышыр өчен челтәрләр юк иде. Мондый мөмкинлекләр барлыкка килгәч, мәгълүмат мөмкин булган барлык тарафларны тулысынча биләп алдылар. Әмма челтәрләрнең уздыручанлыгы һәм мәгълүматны саклау мөмкинлекләре күпме генә киңәйтелмәсен, без тапшыра алганнан күбрәк мәгълүмат тудыра торган чыганаклар, мәсәлән, физик экспериментлар, канатның агым уздыручанлыгын модельләштерү буенча экспериментлар кебек чыганаклар гел табылып торачак. Мур законы буенча, хәзерге параллель исәпләү системаларының җитештерүчәнлеге даими рәвештә үсә, шулай ук мәгълүмат алышу челтәрләренең дә тизлекләре үсә. Әмма ләкин мәгълүматны тиз саклый белергә һәм саклагычтан (каты диск яки башка төрле хәтер җайланмаларыннан) тиз арада чыгара белергә кирәк, һәм бу зур мәгълүматны эшкәртүгә караган тагын бер мәсьәлә.
Станислав Протасов, физика-математика фәннәре кандидаты, Иннополис университетының фәнни хезмәткәре
Айсылу Кәбирова, Эльвира Зиннәтуллина, Рәхимә Шиһапова, Резеда Миргаязова тәрҗемәсе
постердагы фото: orvalrochefort