کارنگ رسانه اقتصاد نوآوری است. در کارنگ ما تلاش داریم کسبوکارهای نوآور ایرانی، استارتاپها، شرکتهای دانشبنیان و دیگر کسبوکارها کوچک و بزرگی که در بخشهای مختلف اقتصاد نوآوری در حال ارائه محصول و خدمت هستند را مورد بررسی قرار دهیم و از آینده صنعت، تولید، خدمات و دیگر بخشهای اقتصاد بگوییم. کارنگ رسانهای متعلق به بخش خصوصی ایران است.
برخی از صاحبنظران مدیریت داده، برای شرح کلانداده (Big Data) چنین گفتهاند: «مقدار عظیم، طاقتفرسا و غیرقابل کنترل اطلاعات».
جان گرانت نیز آنگاه که در سال ۱۶۶۳ در حال بررسی طاعون بوبونیک بود که اروپای آن زمان را به ویرانی میکشاند، با «مقدار بسیار زیاد اطلاعات» سروکار داشت. گرانت از بررسیهای آماری استفاده کرد که او را در جایگاه نخستین فردی نشاند که از تجزیه و تحلیل دادههای آماری استفاده کرده است. در اوایل دهه ۱۸۰۰ حوزه آمار به گردآوری و تجزیه و تحلیل دادهها گسترش یافت.
برای درک رشد اندازه کلاندادهها نیازی نیست تا به پیشتر برگردیم و به سال ۱۶۶۳ نگاه کنیم. کلانداده بسته به اینکه چه کسی درباره آن صحبت میکند موضوعی نسبی است. کلانداده برای آمازون یا گوگل با آنچه در یک سازمان بیمه با اندازه متوسط رخ میدهد متفاوت است.
گامهای اساسی برای رسیدن به مفهوم مدرن کلانداده شامل توسعه رایانهها، تلفنهای هوشمند، اینترنت و تجهیزات وابسته به حسگرها (اینترنت اشیا) برای فراهم کردن دادههاست. کارتهای اعتباری نیز با ارائه مقادیر فزایندهای از دادهها در این مسیر نقش داشتند. تردیدی نیست که رسانههای اجتماعی توانستند ماهیت حجم دادهها را به روشهای جدید که همچنان در حال توسعه است تغییر دهند. تکامل فناوری مدرن با تکامل کلاندادهها در هم تنیده شده است.
شکلگیری کلانداده
در سال ۱۸۸۰ دادهها برای اداره سرشماری ایالات متحده دردسرآفرین شد. برآورد آنها این بود که پردازش دادههای گردآوریشده در آن سرشماری هشت سال زمان میبرد و پیشبینی کردند که پردازش دادههای سرشماری ۱۸۹۰ بیش از ۱۰ سال زمان نیاز دارد. در سال ۱۸۸۱ مرد جوانی به نام «هرمان هولریث» که برای دفتر سرشماری کار میکرد، ماشین جدولبندی هولریث را ایجاد کرد. اختراع او بر اساس کارتهای سوراخشده بود که در دستگاههای بافندگی مکانیکی برای کنترل نقشونگارهای بافتهشده بهکار میرفت؛ دستگاه جدولبندی هولریث زمان ۱۰ سال را به سه ماه کاهش داد.
ظهور نخستین پردازشگرهای داده
در سال ۱۹۲۷ یک مهندس اتریشی-آلمانی به نام «فریتز فلومر» ابزاری برای ذخیره اطلاعات به شکل مغناطیسی روی نوار ساخت. فلومر روشی برای چسباندن نوارهای فلزی به کاغذ سیگار ابداع کرده بود (برای اینکه لبهای سیگاریها توسط کاغذهای سیگارپیچی آلوده نشود) و تصمیم گرفت از این روش برای ایجاد یک نوار مغناطیسی استفاده کند. او پس از آزمایشهایی با مواد گوناگون، اختراع خود را که کاغذ بسیار نازک آعشتهشده با پودر اکسید آهن بود در سال ۱۹۲۸ ثبت کرد.
در طول جنگ جهانی دوم (به طور مشخص در سال ۱۹۴۳) بریتانیاییها که ناامید از شکستن رمزگذاریهای نازیها بودند، دستگاهی ساختند که الگوهای پیامهای رهگیریشده از سوی آلمانیها را پردازش میکرد. این دستگاه Colossus نام داشت و میتوانست ۵۰۰۰ حرف را در ثانیه پردازش کند و حجم کار را از چند هفته به چند ساعت کاهش دهد. دستگاه Colossus نخستین پردازشگر داده بود. دو سال پس از آن در سال ۱۹۴۵ جان فون نویمان مقالهای درباره رایانه خودکار متغیر گسسته الکترونیکی EDVAC نوشت که نخستین بحث مستندشده درباره ذخیرهسازی برنامهها بود که معماری رایانههای امروزی را بنیان نهاد. گفته میشود این رخدادها منجر به شکلگیری رسمی آژانس امنیت ملی ایالات متحده NSA از سوی ترومن، رئیسجمهور آمریکا در سال ۱۹۵۲ شد. کارمندان این آژانس وظیفه رمزگشایی پیامهای رهگیریشده در طول جنگ سرد را بر عهده داشتند. رایانههای آن زمان بدان پایه از پیشرفت رسیده بودند که قادر به گردآوری و پردازش مستقل و خودکار دادهها باشند.
اینترنت و رایانههای شخصی
در ۲۹ اکتبر ۱۹۶۹ کار شبکه آرپانت با ارسال پیامی از رایانه میزبان در دانشگاه یوسیالای به رایانه میزبان در دانشگاه استنفورد آغاز شد، اما مردم از وجود این طرح آگاه نبودند. با این حال در سال ۱۹۸۹ زیرساختهای آرپانت رو به پیر شدن رفت و آن سامانه به اندازه شبکههای جدید کارآمد و سریع نبود. سازمانهایی که از این سیستم استفاده میکردند به سوی شبکههای دیگر مانند NSFNET حرکت کردند. در سال ۱۹۹۰ آرپانت تعطیل شد اما این طرح، اینترنت را برای بشر به ارمغان آورده بود.
در سال ۱۹۶۵ دولت ایالات متحده اولین مرکز داده را با هدف ذخیره میلیونها مجموعه اثر انگشت و اظهارنامه مالیاتی ایجاد کرد. دادهها به نوارهای مغناطیسی منتقل شدند و قرار بود در یک مکان مرکزی ذخیره شوند. نظریهپردازان توطئه، ترس خود را از اجرایی شدن این برنامه بیان کردند که منجر به ناتمام ماندن طرح شد. اما این ابتکار نخستین تلاش ثبتشده برای ذخیرهسازی داده در اندازه بزرگ بود.
در سال ۱۹۸۹ «تیم برنرز لی» مفهوم شبکه جهانی وب (World Wide Web) را مطرح کرد. هدف او بهاشتراکگذاری اطلاعات با استفاده از یک سامانه فرامتن بود. در پاییز سال ۱۹۹۰ برنرز لی که برای «سرن» کار میکرد، سه دستور اصلی فناوری اطلاعات را نوشت که همچنان اساس وب امروزی هستند:
HTML :(Hyper Text Markup Language) زبان نشانهگذاری فرامتن؛ زبان قالببندی وب
URL :(Uniform Resource Locator) منبعیاب یکنواخت؛ یک «آدرس» منحصربهفرد برای شناسایی هر منبع که در وب استفاده میشود.
HTTP :(HyperText Transfer Protocol) شیوهنامه انتقال فرامتن؛ برای بازیابی منابع مرتبط از سراسر وب استفاده میشود.
در سال ۱۹۹۳ سرن اعلام کرد که شبکه جهانی وب برای توسعه و استفاده همگانی رایگان است. بخش رایگان عنصری کلیدی در اثرگذاری وب بر مردم جهان بود.
ذخیرهسازی کلانداده
ذخیره مغناطیسی همچنان یکی از کمهزینهترین روشهای ذخیره داده است. نوارهای راهراه مغناطیسی فلومر، خود را با شکلهای گوناگون از استوانهها، فلاپیدیسکها و دیسکهای سخت سازگار کرد. در سالهای اخیر ذخیرهسازی ابری دادهها ابزاری است که در این زمینه محبوب شده است. نخستین کلود در سال ۱۹۸۳ ظاهر شد؛ آنگاه که CompuServe به مشتریان خود ۱۲۸ کیلوبایت فضای داده برای ذخیرهسازی شخصی و خصوصی ارائه داد. پیشرفتهای فنی در اینترنت همراه با کاهش هزینههای ذخیرهسازی داده، استفاده از فضای ابری برای ذخیرهسازی دادههای کسبوکارها و افراد را اقتصادیتر کرده است.
پایهگذاران کلاندادهها
در سالهای اخیر، کلانداده دنیای کسبوکارهای امروزی را دگرگون کرده است. کلانداده ترکیبی از دادههای ساختاریافته، نیمهساختاریافته و بدون ساختار و دستهای از اطلاعات است که سازمانها آن را برای اهداف تجاری استخراج میکنند و از طریق یادگیری ماشینی، ساخت مدلهای پیشبینی و دیگر برنامههای کاربردی تجزیه و تحلیل دادههای پیشرفته آن را به کار میگیرند. بستر کاربرد کلانداده از آنجا شکل گرفت که افرادی باهوش ارزش روی آوردن به آمار و تجزیه و تحلیل را برای فهم دنیای پیرامون خود درک کردند. در ادامه نگاهی به روند شکلگیری فناوری در این حوزه و شخصیتهای تأثیرگذار در آن خواهیم داشت.
۱۶۶۳: «جان گرانت» تجزیه و تحلیل دادههای آماری را با کار روی طاعون بوبونیک معرفی کرد.
۱۸۶۵: «ریچارد میلار دیونز» اصطلاح «هوش تجاری» را پدید آورد که به معنای فرآیند تجزیه و تحلیل دادهها و کاربرد آن برای ارائه اطلاعات عملی بود.
۱۸۸۴: «هرمان هولریث» دستگاه جدولبندی بر پایه کارت منگنه را اختراع و پردازش دادهها را آغاز کرد. دستگاه هولریث برای پردازش دادههای سرشماری ۱۸۹۰ ایالات متحده به کار گرفته شد. وی در سال ۱۹۱۱ شرکت Computing-Tabulating-Recording را ایجاد کرد که در ادامه به IBM تبدیل شد.
۱۹۲۶: «نیکولا تسلا» پیشبینی کرد روزی انسانها به وسیله ابزاری که آن را میتوان «در جیب جلیقه» جابهجا کرد، به بخشهای بزرگی از دادهها دسترسی خواهند داشت.
۱۹۲۸: «فریتز فلومر» راهی برای ذخیره اطلاعات روی نوار مغناطیسی ابداع کرد. این فرآیند سرانجام وی را به سوی ساخت نوار مغناطیسی کشاند که بنیان نوارهای کاست و موارد دیگر شد.
۱۹۴۳: یکی از نخستین دستگاههای پردازش داده برای رمزگشایی کدهای نازیها در طول جنگ جهانی دوم در بریتانیا ساخته شد. دستگاه Colossus مقایسههای منطقی و شمارش لازم برای تجزیه و تحلیل حجم زیادی از دادهها را انجام میداد.
۱۹۵۹: «آرتور ساموئل» برنامهنویس IBM و پیشگام هوش مصنوعی اصطلاح یادگیری ماشینی را ابداع کرد.
۱۹۶۵: برنامه ساخت نخستین مرکز داده برای ذخیره اظهارنامه مالیاتی و اثر انگشت روی نوار مغناطیسی در آمریکا آغاز، اما رها شد.
۱۹۶۹: شبکه ارتباطی «آرپانت» که نخستین شبکه گسترده ارتباطی شامل کنترل توزیعشده بر پایه شیوهنامه ارتباطی TCI/IP بود، ایجاد شد که بنیان اینترنت امروزی را شکل داد.
۱۹۸۹ و ۱۹۹۰: «تیم برنرز لی» و «رابرت کالیو» در زمان کار CERN شبکه جهانی وب را ایجاد کردند و دوران اینترنت با دسترسی گسترده و آسان به دادهها آغاز شد.
۱۹۹۶: برای نخستینبار ذخیرهسازی دادههای دیجیتال بهصرفهتر از ذخیره اطلاعات روی کاغذ شد.
۱۹۹۷: دامنه google.com یک سال پیش از راهاندازی ثبت شد. برآمدن موتور جستوجو موجب توسعه بسیاری از نوآوریهای دیگر ازجمله یادگیری ماشینی، کلانداده و تجزیه و تحلیل شد.
۱۹۹۸: پایگاه داده رابطهای منبعباز NoSQL توسط «کارلو استروزی» توسعه داده شد که راهی برای ذخیره و بازیابی دادههای مدلسازیشده به گونهای متفاوت از پایگاه دادههای سنتی ارائه کرد.