کلان داده big data چیست؟
امروزه دادهها بخش مهمی از ارکان اقتصاد جهانی هستند و مانند سایر عوامل اساسی تولید مانند داراییهای فیزیکی و نیروی انسانی، بسیاری از فعالیتهای اقتصادی مدرن بدون وجود دادهها امکانپذیر نیست. استفاده از کلان داده big data به مبنای اصلی رقابت و رشد شرکتهای فعلی تبدیل شده و بهرهوری را افزایش داده است. جمعآوری و تحلیل دادهها در مقیاس بزرگ به عنصر جدیدی در تمایزگذاری رقابتی تبدیل شده است. درحالیکه شرکتهایی مانند آمازون، گوگل و نتفلیکس همۀ توجهها را در این فضا به خود جلب کردهاند، شرکتهای دیگر بیسروصدا درحال پیشرفت هستند. شرکتهای فعال در صنایع مختلفی از داروسازی گرفته تا خردهفروشی و مخابرات و بیمه در سالهای اخیر با استراتژیهای کلان داده big data مشغول پیشروی بودهاند. فعالیت این شرکتها رویکردهای استراتژیک جدیدی را در قبال کلان داده big data نشان میدهد. در این مقاله ابتدا بررسی میکنیم کلان داده big data چیست، سپس به کاربردهای بیگدیتا یا کلانداده میپردازیم و در آخر جایگاه بیگدیتا را در ایران واکاوی میکنیم.
کلان داده big data چیست؟
کلان داده دقیقاً چیست؟ کلانداده را میتوان مجموعه دادههایی تعریف کرد که اندازه یا نوع آنها فراتر از توانایی پایگاه دادههایی است که معمولاً برای جمعآوری، مدیریت و پردازش دادهها استفاده میشود؛ برای مثال، پایگاه دادهای رابطهای از پس پردازش چنین دادههایی برنمیآید. از ویژگیهای کلانداده میتوان به حجم، سرعت و تنوع بالای آن اشاره کرد. منابع دادههای کنونی در مقایسه با منابع دادههای سنتی پیچیدهتر هستند؛ زیرا با استفاده از هوش مصنوعی (AI)، دستگاههای تلفن همراه، رسانههای اجتماعی و اینترنت اشیا (IoT) گردآوری شدهاند. برای مثال، میتوان به انواع مختلف دادههایی اشاره کرد که از حسگرها، دستگاهها، صوت و تصویر، شبکهها، فایلهای گزارش، اپلیکیشن تراکنشها، وب و رسانههای اجتماعی به دست میآیند؛ بیشتر این دادهها بیدرنگ و در مقیاس بسیار بزرگ تولید شدهاند.
کاربردهای بیگ دیتا یا کلان داده
سابقۀ سرمایهگذاری و نوآوری در فناوری اطلاعات (IT) و تأثیر آن بر رقابت و بهرهوری نشان میدهد کلان داده big data هم میتواند نقش مشابهی در تغییر زندگی ما ایفا کند. همان پیششرطهایی که به IT امکان میدهد بهرهوری را افزایش دهد، در مورد کلانداده نیز صادق است و انتظار داریم تأمینکنندگان فناوری کلانداده به اندازه تأمینکنندگان انواع دیگر IT بر بهرهوری تأثیر بگذارند. همۀ شرکتها باید کلانداده و پتانسیل آن برای خلق ارزش را جدی بگیرند. برای مثال، خردهفروشی که از کلانداده استفاده میکند قادر است حاشیۀ سود خود را تا 60 درصد افزایش دهد. استفاده از کلان داده راهحلی کلیدی برای شرکتهای پیشرو است تا عملکردی بهتر از همتایان خود داشته باشند. در بیشتر صنایع، رقبای تثبیتشده و تازهواردان بهطور یکسان از استراتژیهای دادهمحور برای نوآوری، رقابت و خلق ارزش استفاده میکنند.
کلانداده به ایجاد فرصتهای رشد جدید کمک میکنند و شرکتهایی با وظایف و عملکردهای کاملاً جدید ایجاد میکنند، مانند شرکتهایی که دادههای صنعتی را تجمیع و تحلیل میکنند. بسیاری از این شرکتها تشکیلاتی هستند که در میانهٔ جریانهای اطلاعاتی بزرگ و در آن قسمتهایی قرار میگیرند که میتوان دادههای مربوط به محصولات و خدمات، خریداران و تأمینکنندگان، ترجیحات و اهداف مصرفکننده را جمعآوری و تحلیل کرد. رهبران آیندهنگر در صنایع مختلف باید با جدیت شروع به ارتقای تواناییهای سازمان خود در عرصۀ کلانداده کنند. علاوه بر مقیاس کلانداده، ماهیت بیدرنگ و پربسامد آنها نیز کلیدی است. برای مثال، ماهیت بیدرنگ کلانداده «اکنونبینی» (nowcasting) را میسر میکند و توان قابلتوجهی به پیشبینیها میدهد. بهطور مشابه، دادههای پربسامد این امکان را به کاربران میدهند که فرضیهها را بیدرنگ و در سطحی که قبلاً هرگز ممکن نبود، آزمایش کنند. ما پنج حوزۀ کاربردهای بیگدیتا یا کلانداده را بهدقت بررسی کردیم: مراقبتهای بهداشتی و خردهفروشی در ایالات متحده، بخش عمومی در اروپا، دادههای موقعیت مکانی شخصی در سطح جهانی، و برخی روشهای کاربردی استفاده از کلان داده big data.
این بررسی نشان داد که کلانداده میتوانند بهواسطهٔ شفافسازی اطلاعات درهای جدیدی به روی کسبوکارها بگشایند. زمانی که سازمانها دادههای معاملاتی بیشتری را بهشکل دیجیتالی ایجاد و ذخیره میکنند، میتوانند اطلاعات عملکردی دقیقتر و مفصلتری دربارۀ همهچیز از موجودی محصولات گرفته تا روزهای بیماری جمعآوری کنند و بنابراین نوسانها را آشکار کنند و عملکرد را افزایش دهند. در واقع، برخی از شرکتهای پیشرو از توانایی جمعآوری و تحلیل کلانداده برای انجام آزمایشهای کنترلشده استفاده میکنند تا بدینوسیله تصمیمات مدیریتی بهتری اتخاذ کنند. همچنین کلانداده به سازمانها امکان میدهند مشتریانِ خود (یا در عرصۀ سلامت، بیماران) را دقیقتر تقسیمبندی کنند و در نتیجه محصولات یا خدمات را با دقت بیشتری متناسبسازی کنند. در نهایت، تحلیلهای پیچیده و پیشرفته میتواند تصمیمگیری را به میزان چشمگیری بهبود بخشد، خطرات را به حداقل برساند، و دانستههای ارزشمندی را که پیشتر پنهان بودند، کشف کند. سرانجام، و شاید جالبتر از همه، آنکه کلانداده میتوانند کیفیت نسل بعدی محصولات و خدمات را بهبود دهند. برای مثال، تولیدکنندگان از دادههای بهدستآمده از حسگرهایی که در محصولات تعبیه شدهاند میتوانند برای ارائۀ خدمات پس از فروش نوآورانهای مانند نگهداشت پیشگیرانه استفاده کنند.
اما ارزشی که کلانداده خلق میکند چقدر اهمیت دارند؟ برای مثال، طبق گزارشی که مکنزی منتشر کرده است، اگر سیستم مراقبتهای بهداشتی ایالات متحده کلانداده را بهطور خلاقانه و مؤثری به کار گیرد تا بهرهوری و کیفیت را افزایش دهد، این بخش می تواند بیش از 300 میلیارد دلار در سال ارزش خلق کند. دوسوم این مقدار بهشکل کاهش حدود 8 درصدی هزینۀ مراقبتهای بهداشتی ایالات متحده خواهد بود. در کشورهای توسعهیافتۀ اروپا، مدیران دولتی با استفاده از کلانداده میتوانند بیش از ۱۴۹ میلیارد دلار از طریق بهبود بهرهوری عملیاتی صرفهجویی کنند و تازه این مبلغ شامل استفاده از ابزارهای کلانداده برای کاهش کلاهبرداری و خطا و افزایش جمعآوری درآمدهای مالیاتی نمیشود.
اما این فقط شرکتها و سازمانها نیستند که از ارزشی که کلانداده میتواند خلق کنند، منتفع میشوند؛ مصرفکنندگان نیز میتوانند از مزایای بسیاری بهره ببرند. برای مثال، کاربران خدمات مربوط به دادههای موقعیت مکانی شخصی میتوانند 600 میلیارد دلار مازاد مصرفکننده را جذب کنند. مسیریابی هوشمند با استفاده از اطلاعات ترافیکی بیدرنگ یکی از محبوبترین کاربردهای دادههای موقعیت مکانی شخصی است. با افزایش ضریب نفوذ تلفنهای هوشمند و گنجاندن اپلیکیشنهای مسیریابی رایگان در این دستگاهها، استفاده از مسیریابی هوشمند افزایش یافته است. در سال 2020 بیش از 70 درصد تلفنهای همراه دارای قابلیت GPS بودند. در مجموع، ارزش جهانی بالقوۀ مسیریابی هوشمند در قالب صرفهجویی در زمان و سوخت حدوداً 500 میلیارد دلار تا سال 2020 تخمین زده شده است. این مبلغ معادل صرفهجویی 20 میلیارد ساعت برای رانندگان یا 10 تا 15 ساعت در سال برای هر مسافر و حدود 150 میلیارد دلار در مصرف سوخت است.
برخی از مهمترین ظرفیتها برای خلق ارزش از کلانداده از ترکیب مجموعههای متفاوت و جداگانهای از دادهها حاصل میشود. برای مثال، سیستم مراقبتهای بهداشتی ایالات متحده چهار مجموعه دادۀ اصلی دارد: دادههای بالینی، دادههای مربوط به مطالبات و هزینهها، دادههای مربوط به تحقیق و توسعۀ محصولات دارویی و پزشکی، و دادههای مربوط به رفتار و احساسات بیمار. هرکدام از این دادهها توسط حوزههای متفاوتی نگهداری میشوند. مکنزی تخمین می زند اگر مراقبتهای بهداشتی ایالات متحده از تمام ابزارهای موجود برای مدیریت کلانداده بهطور کامل استفاده کند، بهرهوری سالانه این بخش میتواند 0.7 درصد افزایش پیدا کند. اما دستیابی به این نرخ بهرهوری مستلزم دسترسی به دادهها است، آن هم در مقیاسی فراتر از آنچه یک سازمان تولید میکند و ممکن است نیاز باشد مجموعهای از دادهها مانند سوابق بیمار و مطالبات بالینی با هم ترکیب شوند.
ترکیب دادهها نه تنها برای بازیگران صنایع مختلف بلکه برای بیمارانی که دسترسی گستردهتر به طیف وسیعتری از اطلاعات مراقبتهای بهداشتی دارند، مزایایی ایجاد میکند و آنها را به مصرفکنندگان آگاهتر نظام درمان تبدیل میکند. بیماران نهتنها میتوانند قیمت داروها، هزینههای درمان و نرخ ویزیت پزشکان، بلکه اثربخشی نسبی آنها را نیز با هم مقایسه کنند و داروهای مؤثرتر و هدفمندتری انتخاب کنند؛ حتی میتوانند داروهایی را مصرف کنند که برای ترکیب ژنتیکی و مولکولی شخصی آنها سفارشیسازی شده است. برای بهرهمندی از این مزایای گسترده، مصرفکنندگان مراقبتهای بهداشتی ممکن است مجبور شوند کمی از حریم خصوصی خود را افشا کنند. این امر مانعی قابلتوجه برای استفاده از کلانداده در بسیاری از کشورها است، اما در مقابل مزایای چشمگیری در پی دارد. حساسیتها دربارۀ حریم خصوصی – و در واقع امنیت دادهها – تنها مانعی است که شرکتها و دولتها باید بر آن غلبه کنند تا منافع اقتصادی مربوط به کلانداده محقق شود.
برای استفاده بهینه از کلانداده، بسیاری مسائل فناورانه وجود دارد که باید حل شوند. سیستمهای قدیمی و استانداردها و قالبهای ناسازگار اغلب از یکپارچهسازی دادهها و تحلیلهای پیشرفته جلوگیری میکنند و سازمانها برای غلبه بر این مانع باید فناوریها و تکنیکهای جدیدی را در حین توسعه به کار گیرند. در نهایت، استفاده از مجموعه دادههای دیجیتالی بزرگ مستلزم گردهمآوردن فناوریهای مختلفی برای ذخیرهسازی و محاسبات از طریق برنامههای نرمافزار تحلیلی و بصری است. مهمتر از همه، دسترسی به دادهها باید گسترش پیدا کند. شرکتها بهطور فزایندهای نیاز به دسترسی به دادههای اشخاص ثالث و ادغام آنها با دادههای خود خواهند داشت، اما امروزه بازارهای کارآمدی برای مبادله یا اشتراک دادهها در دسترس نیست. برای مثال، هیچ بازاری برای اشتراک آن دسته از الگوهای حرکت تودهای وجود ندارد که از تلفنهای همراه استخراج شده است.
کلان داده big data در ایران
در دنیای امروز، حجم بالای دادههای بهدستآمده از طریق شبکۀ وب و فضای ابری، فرصتهای جدیدی را برای شناسایی و خلق ارزش و اطلاعات تجاری در اختیار سازمانها قرار می دهد. بنابراین وضعیت کلان دادهها در ایران با تکیه بر اهمیت این نوع دادهها مورد توجه قرار میگیرد. بر همگان آشکار است که دولت بهمنظور بهرهگیری از این فناوری جدید و تحلیل اطلاعات باید ظرفیتهای جدیدی ایجاد کند. خوشبختانه حوزۀ کلان داده یا همان بیگ دیتا در ایران نیز مورد توجه قرار گرفته است. بهطوری که در اسفند سال ۹۶ گزارشی تحلیلی که حاصل نخستین پیمایش کلانداده در سراسر کشور بود، از سوی وزارت ارتباطات و فناوری اطلاعات با هدف شناسایی وضعیت موجود و نیز چالشهای پیش روی توسعه کلانداده در کشور ارائه شد.
در حال حاضر هر یک از سازمانها، وزارتخانهها و ادارات دولتی دارای بانک اطلاعاتی متنوعی هستند. با تجمیع و یکپارچهسازی بانکهای اطلاعاتی و سرمایهگذاری در این رابطه و تحلیل هوشمند آنها میتوان در مسیری قرار گرفت که سیاستگذاریها و برنامهریزیهای کشور واقعبینانه و با دقت بالایی صورت پذیرد.
شاید بهرسمیتنشناختن اطلاعات و دادهها بهعنوان سرمایه و موضوع کسبوکار از سوی دولت مهمترین چالش این حوزه باشد. در زیر چالشهای مهم در این زمینه مطرح میگردد:
- منابع مختلف اطلاعاتی- تحلیل دادهها در سیستمهای قدیمی و جدید در گرو یافتن ساختار و قالبی پیوسته است.
- جمعآوری اطلاعات از منابع چندگانه – با وجود ساختاریافتهبودن دادهها در دولت، جمعآوری آنها از منابع مختلف دشوار است.
- تقسیمبندی اطلاعات به عمومی و محرمانه- عدم تمایل سازمانها برای اشتراک آنچه دادههای اختصاصی میدانند.
- امنیت اطلاعات و تضمین حقوق شهروندی- نگرانی از استفادۀ نادرست و غیراصولی از اطلاعات، با نیت غیرقانونی برای همیشه وجود دارد.
- نیروی متخصص و کارآمد- مراقبت از دیتا و امنیت آنها از یکسو و اجرای تحلیلهای مؤثر و سودمند از سوی دیگر نیازمند ابزار و دانش سازمانی است که سازمانهای دولتی در شرایط فعلی کمتر واجد چنین مهارتهایی هستند.
در ایران خیلی از افراد و نهادها دربارۀ کلانداده صحبت میکنند، اما دستاورد چندانی به چشم نمیخورد. نتیجه آنکه وضعیت کلانداده در ایران هنوز در حد مطلوب نیست و همچنان ضرورت سرمایهگذاری در این زمینه بهشدت احساس میشود.