کلان داده big data چیست؟

مارس 3, 1401
.jpg


کلان داده big data چیست؟



امروزه داده‌ها بخش مهمی از ارکان اقتصاد جهانی هستند و مانند سایر عوامل اساسی تولید مانند دارایی‌های فیزیکی و نیروی انسانی، بسیاری از فعالیت‌های اقتصادی مدرن بدون وجود داده‌ها امکان‌پذیر نیست. استفاده از کلان داده big data به مبنای اصلی رقابت و رشد شرکت‌های فعلی تبدیل شده و بهره‌وری را افزایش داده است. جمع‌آوری و تحلیل داده‌ها در مقیاس بزرگ به عنصر جدیدی در تمایزگذاری رقابتی تبدیل شده‌ است. در‌حالی‌که شرکت‌هایی مانند آمازون، گوگل و نتفلیکس همۀ توجه‌ها را در این فضا به خود جلب کرده‌اند، شرکت‌های دیگر بی‌سر‌و‌‌صدا در‌حال پیشرفت هستند. شرکت‌های فعال در صنایع مختلفی از داروسازی گرفته تا خرده‌فروشی و مخابرات و بیمه در سال‌های اخیر با استراتژی‌های کلان داده big data مشغول پیشروی بوده‌اند. فعالیت‌ این شرکت‌ها رویکردهای استراتژیک جدیدی را در قبال کلان داده big data نشان می‌دهد. در این مقاله ابتدا بررسی می‌کنیم کلان داده big data چیست، سپس به کاربردهای بیگ‌دیتا یا کلان‌داده می‌پردازیم و در آخر جایگاه بیگ‌دیتا را در ایران واکاوی می‌کنیم.


کلان داده big data چیست؟

کلان‌ داده دقیقاً چیست؟ کلان‌داده را می‌توان مجموعه داده‌هایی تعریف کرد که اندازه یا نوع آن‌ها فراتر از توانایی پایگاه‌ داده‌هایی است که معمولاً برای جمع‌آوری، مدیریت و پردازش داده‌ها استفاده می‌شود؛ برای مثال، پایگاه داده‌ای رابطه‌ای از پس پردازش چنین داده‌هایی برنمی‌آید. از ویژگی‌های کلان‌داده می‌توان به حجم، سرعت و تنوع بالای آن اشاره کرد. منابع داده‌های کنونی در مقایسه با منابع داده‌های سنتی پیچیده‌تر هستند؛ زیرا با استفاده از هوش مصنوعی (AI)، دستگاه‌های تلفن همراه، رسانه‌های اجتماعی و اینترنت اشیا (IoT) گردآوری شده‌اند. برای مثال، می‌توان به انواع مختلف داده‌هایی اشاره کرد که از حسگرها، دستگاه‌ها، صوت و تصویر، شبکه‌ها، فایل‌های گزارش، اپلیکیشن تراکنش‌ها، وب و رسانه‌های اجتماعی به دست می‌آیند؛ بیشتر این داده‌ها بی‌درنگ و در مقیاس بسیار بزرگ تولید شده‌اند.



کاربردهای بیگ‌ دیتا یا کلان‌ داده‌

سابقۀ سرمایه‌گذاری و نوآوری در فناوری اطلاعات (IT) و تأثیر آن بر رقابت و بهره‌وری نشان می‌دهد کلان داده big data هم می‌تواند نقش مشابهی در تغییر زندگی ما ایفا کند. همان پیش‌شرط‌هایی که به IT امکان می‌دهد بهره‌وری را افزایش دهد، در مورد کلان‌داده نیز صادق است و انتظار داریم تأمین‌کنندگان فناوری کلان‌داده به اندازه تأمین‌کنندگان انواع دیگر IT بر بهره‌وری تأثیر بگذارند. همۀ شرکت‌ها باید کلان‌داده و پتانسیل آن برای خلق ارزش را جدی بگیرند. برای مثال، خرده‌فروشی که از کلان‌داده استفاده می‌کند قادر است حاشیۀ سود خود را تا 60 درصد افزایش دهد. استفاده از کلان‌ داده راه‌حلی کلیدی برای شرکت‌های پیشرو است تا عملکردی بهتر از همتایان خود داشته باشند. در بیشتر صنایع، رقبای تثبیت‌شده و تازه‌واردان به‌طور یکسان از استراتژی‌های داده‌محور برای نوآوری، رقابت و خلق ارزش استفاده می‌کنند.



کلان‌داده به ایجاد فرصت‌های رشد جدید کمک می‌کنند و شرکت‌هایی با وظایف و عملکردهای کاملاً جدید ایجاد می‌کنند، مانند شرکت‌هایی که داده‌های صنعتی را تجمیع و تحلیل می‌کنند. بسیاری از این شرکت‌ها تشکیلاتی هستند که در میانهٔ جریان‌های اطلاعاتی بزرگ و در آن قسمت‌هایی قرار می‌گیرند که می‌توان داده‌های مربوط به محصولات و خدمات، خریداران و تأمین‌کنندگان، ترجیحات و اهداف مصرف‌کننده را جمع‌آوری و تحلیل کرد. رهبران آینده‌نگر در صنایع مختلف باید با جدیت شروع به ارتقای توانایی‌های سازمان خود در عرصۀ کلان‌داده کنند. علاوه بر مقیاس کلان‌داده، ماهیت بی‌درنگ و پربسامد آن‌ها نیز کلیدی است. برای مثال، ماهیت بی‌درنگ کلان‌داده «اکنون‌بینی» (nowcasting) را میسر می‌کند و توان قابل‌توجهی به پیش‌بینی‌ها می‌دهد. به‌طور مشابه، داده‌های پربسامد این امکان را به کاربران می‌دهند که فرضیه‌ها را بی‌درنگ و در سطحی که قبلاً هرگز ممکن نبود، آزمایش کنند. ما پنج حوزۀ کاربردهای بیگ‌دیتا یا کلان‌داده را به‌دقت بررسی کردیم: مراقبت‌های بهداشتی و خرده‌فروشی در ایالات متحده، بخش عمومی در اروپا، داده‌های موقعیت مکانی شخصی در سطح جهانی، و برخی روش‌های کاربردی استفاده از کلان داده big data.

این بررسی نشان داد که کلان‌داده می‌توانند به‌واسطهٔ شفاف‌سازی اطلاعات درهای جدیدی به روی کسب‌وکارها بگشایند. زمانی که سازمان‌ها داده‌های معاملاتی بیشتری را به‌شکل دیجیتالی ایجاد و ذخیره می‌کنند، می‌توانند اطلاعات عملکردی دقیق‌تر و مفصل‌تری دربارۀ همه‌چیز از موجودی محصولات گرفته تا روزهای بیماری جمع‌آوری کنند و بنابراین نوسان‌ها را آشکار کنند و عملکرد را افزایش دهند. در واقع، برخی از شرکت‌های پیشرو از توانایی جمع‌آوری و تحلیل کلان‌داده برای انجام آزمایش‌های کنترل‌شده استفاده می‌کنند تا بدین‌وسیله تصمیمات مدیریتی بهتری اتخاذ کنند. همچنین کلان‌داده به سازمان‌ها امکان می‌دهند مشتریانِ خود (یا در عرصۀ سلامت، بیماران) را دقیق‌تر تقسیم‌بندی کنند و در نتیجه محصولات یا خدمات را با دقت بیشتری متناسب‌سازی کنند. در نهایت، تحلیل‌های پیچیده و پیشرفته می‌تواند تصمیم‌گیری را به میزان چشمگیری بهبود بخشد، خطرات را به حداقل برساند، و دانسته‌های ارزشمندی را که پیش‌تر پنهان بودند، کشف کند. سرانجام، و شاید جالب‌تر از همه، آنکه کلان‌داده می‌توانند کیفیت نسل بعدی محصولات و خدمات را بهبود دهند. برای مثال، تولیدکنندگان از داده‌های به‌دست‌آمده از حسگرهایی که در محصولات تعبیه شده‌اند می‌توانند برای ارائۀ خدمات پس از فروش نوآورانه‌ای مانند نگهداشت پیشگیرانه استفاده ‌کنند.



اما ارزشی که کلان‌داده خلق می‌کند چقدر اهمیت دارند؟ برای مثال، طبق گزارشی که مکنزی منتشر کرده است، اگر سیستم مراقبت‌های بهداشتی ایالات متحده کلان‌داده را به‌طور خلاقانه و مؤثری به کار گیرد تا بهره‌وری و کیفیت را افزایش دهد، این بخش می تواند بیش از 300 میلیارد دلار در سال ارزش خلق کند. دوسوم این مقدار به‌شکل کاهش حدود 8 درصدی هزینۀ مراقبت‌های بهداشتی ایالات متحده خواهد بود. در کشورهای توسعه‌یافتۀ اروپا، مدیران دولتی با استفاده از کلان‌داده می‌توانند بیش از ۱۴۹ میلیارد دلار از طریق بهبود بهره‌وری عملیاتی صرفه‌جویی کنند و تازه این مبلغ شامل استفاده از ابزارهای کلان‌داده برای کاهش کلاه‌برداری‌ و خطا و افزایش جمع‌آوری درآمدهای مالیاتی نمی‌شود.

اما این فقط شرکت‌ها و سازمان‌ها نیستند که از ارزشی که کلان‌داده می‌تواند خلق کنند، منتفع می‌شوند؛ مصرف‌کنندگان نیز می‌توانند از مزایای بسیاری بهره ببرند. برای مثال، کاربران خدمات مربوط به داده‌های موقعیت مکانی شخصی می‌توانند 600 میلیارد دلار مازاد مصرف‌کننده را جذب کنند. مسیریابی هوشمند با استفاده از اطلاعات ترافیکی بی‌درنگ یکی از محبوب‌ترین کاربردهای داده‌های موقعیت مکانی شخصی است. با افزایش ضریب نفوذ تلفن‌های هوشمند و گنجاندن اپلیکیشن‌های مسیریابی رایگان در این دستگاه‌ها، استفاده از مسیریابی هوشمند افزایش یافته است. در سال 2020 بیش از 70 درصد تلفن‌های همراه دارای قابلیت GPS بودند. در مجموع، ارزش جهانی بالقوۀ مسیریابی هوشمند در قالب صرفه‌جویی در زمان و سوخت حدوداً 500 میلیارد دلار تا سال 2020 تخمین زده شده است. این مبلغ معادل صرفه‌جویی 20 میلیارد ساعت برای رانندگان یا 10 تا 15 ساعت در سال برای هر مسافر و حدود 150 میلیارد دلار در مصرف سوخت است.

برخی از مهم‌ترین ظرفیت‌ها برای خلق ارزش از کلان‌داده از ترکیب مجموعه‌های متفاوت و جداگانه‌ای از داده‌ها حاصل می‌شود. برای مثال، سیستم مراقبت‌های بهداشتی ایالات متحده چهار مجموعه دادۀ اصلی‌ دارد: داده‌های بالینی، داده‌های مربوط به مطالبات و هزینه‌ها، داده‌های مربوط به تحقیق و توسعۀ محصولات دارویی و پزشکی، و داده‌های مربوط به رفتار و احساسات بیمار. هرکدام از این داده‌ها توسط حوزه‌های متفاوتی نگهداری می‌شوند. مکنزی تخمین می زند اگر مراقبت‌های بهداشتی ایالات متحده از تمام ابزارهای موجود برای مدیریت کلان‌داده به‌طور کامل استفاده کند، بهره‌وری سالانه این بخش می‌تواند 0.7 درصد افزایش پیدا کند. اما دستیابی به این نرخ بهره‌‌وری مستلزم دسترسی به داده‌ها است، آن هم در مقیاسی فراتر از آنچه یک سازمان تولید می‌کند و ممکن است نیاز باشد مجموعه‌ای از داده‌ها مانند سوابق بیمار و مطالبات بالینی با هم ترکیب شوند.



ترکیب داده‌ها نه تنها برای بازیگران صنایع مختلف بلکه برای بیمارانی که دسترسی گسترده‌تر به طیف وسیع‌تری از اطلاعات مراقبت‌های بهداشتی دارند، مزایایی ایجاد می‌کند و آن‌ها را به مصرف‌کنندگان آگاه‌تر نظام درمان تبدیل می‌کند. بیماران نه‌تنها می‌توانند قیمت داروها، هزینه‌های درمان‌ و نرخ ویزیت پزشکان، بلکه اثربخشی نسبی آن‌ها را نیز با هم مقایسه کنند و داروهای مؤثرتر و هدف‌مندتری انتخاب کنند؛ حتی می‌توانند داروهایی را مصرف کنند که برای ترکیب ژنتیکی و مولکولی شخصی آن‌ها سفارشی‌سازی شده است. برای بهره‌مندی از این مزایای گسترده، مصرف‌کنندگان مراقبت‌های بهداشتی ممکن است مجبور شوند کمی از حریم خصوصی خود را افشا کنند. این امر مانعی قابل‌توجه برای استفاده از کلان‌داده در بسیاری از کشورها است، اما در مقابل مزایای چشمگیری در پی دارد. حساسیت‌ها دربارۀ حریم خصوصی – و در واقع امنیت داده‌ها – تنها مانعی است که شرکت‌ها و دولت‌ها باید بر آن غلبه کنند تا منافع اقتصادی مربوط به کلان‌داده محقق شود.

برای استفاده بهینه از کلان‌داده، بسیاری مسائل فناورانه وجود دارد که باید حل شوند. سیستم‌های قدیمی و استانداردها و قالب‌های ناسازگار اغلب از یکپارچه‌سازی داده‌ها و تحلیل‌های پیشرفته جلوگیری می‌کنند و سازمان‌ها برای غلبه بر این مانع باید فناوری‌ها و تکنیک‌های جدیدی را در حین توسعه به کار گیرند. در نهایت، استفاده از مجموعه داده‌های دیجیتالی بزرگ مستلزم گرد‌هم‌آوردن فناوری‌های مختلفی برای ذخیره‌سازی و محاسبات از طریق برنامه‌های نرم‌افزار تحلیلی و بصری است. مهم‌تر از همه، دسترسی به داده‌ها باید گسترش پیدا کند. شرکت‌ها به‌طور فزاینده‌ای نیاز به دسترسی به داده‌های اشخاص ثالث و ادغام آن‌ها با داده‌های خود خواهند داشت، اما امروزه بازارهای کارآمدی برای مبادله یا اشتراک داده‌ها در دسترس نیست. برای مثال، هیچ بازاری برای اشتراک آن دسته از الگوهای حرکت توده‌ای وجود ندارد که از تلفن‌های همراه استخراج شده است.


کلان داده big data در ایران

در دنیای امروز، حجم بالای داده‌های به‌دست‌آمده از طریق شبکۀ وب و فضای ابری، فرصت‌های جدیدی را برای شناسایی و خلق ارزش و اطلاعات تجاری در اختیار سازمان‌ها قرار می دهد. بنابراین وضعیت کلان داده‌ها در ایران با تکیه بر اهمیت این نوع داده‌ها مورد توجه قرار می‌گیرد. بر همگان آشکار است که دولت به‌منظور بهره‌گیری از این فناوری جدید و تحلیل اطلاعات باید ظرفیت‌های جدیدی ایجاد کند. خوشبختانه حوزۀ کلان‌ داده یا همان بیگ‌ دیتا در ایران نیز مورد توجه قرار گرفته است. به‌طوری که در اسفند سال ۹۶ گزارشی تحلیلی که حاصل نخستین پیمایش کلان‌داده در سراسر کشور بود، از سوی وزارت ارتباطات و فناوری اطلاعات با هدف شناسایی وضعیت موجود و نیز چالش‌های پیش روی توسعه کلان‌داده در کشور ارائه شد.

در حال حاضر هر یک از سازمان‌ها، وزارتخانه‌ها و ادارات دولتی دارای بانک اطلاعاتی متنوعی هستند. با تجمیع و یکپارچه‌سازی بانک‌های اطلاعاتی و سرمایه‌گذاری در این رابطه و تحلیل هوشمند آن‌ها می‌توان در مسیری قرار گرفت که سیاست‌گذاری‌ها و برنامه‌ریزی‌های کشور واقع‌بینانه و با دقت بالایی صورت پذیرد.

شاید به‌رسمیت‌نشناختن اطلاعات و داده‌ها به‌عنوان سرمایه و موضوع کسب‌و‌کار از سوی دولت مهم‌ترین چالش این حوزه باشد. در زیر چالش‌های مهم در این زمینه مطرح می‌گردد:

  • منابع مختلف اطلاعاتی- تحلیل داده‌ها در سیستم‌های قدیمی و جدید در گرو یافتن ساختار و قالبی پیوسته است.
  • جمع‌آوری اطلاعات از منابع چندگانه – با وجود ساختاریافته‌بودن داده‌ها در دولت، جمع‌آوری آن‌ها از منابع مختلف دشوار است.
  • تقسیم‌بندی اطلاعات به عمومی و محرمانه- عدم تمایل سازمان‌ها برای اشتراک آنچه داده‌های اختصاصی می‌دانند.
  • امنیت اطلاعات و تضمین حقوق شهروندی- نگرانی از استفادۀ نادرست و غیراصولی از اطلاعات، با نیت غیر‌قانونی برای همیشه وجود دارد.
  • نیروی متخصص و کارآمد- مراقبت از دیتا و امنیت آن‌ها از یک‌سو و اجرای تحلیل‌های مؤثر و سودمند از سوی دیگر نیازمند ابزار و دانش سازمانی است که سازمان‌های دولتی در شرایط فعلی کمتر واجد چنین مهارت‌هایی هستند.

در ایران خیلی از افراد و نهادها دربارۀ کلان‌داده صحبت می‌کنند، اما دستاورد چندانی به چشم نمی‌خورد. نتیجه آنکه وضعیت کلان‌داده در ایران هنوز در حد مطلوب نیست و همچنان ضرورت سرمایه‌گذاری در این زمینه به‌شدت احساس می‌شود.


مطالب مرتبط

انقلاب صنعتی چهارم چیست؟
انقلاب صنعتی چهارم چیست؟
ارکان انقلاب صنعتی چهارم
ارکان انقلاب صنعتی چهارم
خلاصه فصل اول کتاب آینده انقلاب صنعتی چهارم
خلاصه فصل اول کتاب آینده انقلاب صنعتی چهارم