کتابخانه عمومی حسینیه ارشاد شنبه 20/۳/96 پنجاه و پنجمین نشست از سلسله نشست های علم اطلاعات و دانش شناسی خود را از ساعت ۱۶:۳۰ تا ۱۸:۳۰ با موضوع "داده های زمان واقعی" برگزار کرد. سخنرانان این نشست خانم اعظم ادهمی خامنه و آقای وحید امیری و دبیر جلسه آقای مصطفی امینی بودند.
صحبت های آقای مصطفی امینی :
بحث امروز ما راجع به چیستی Real-time Data و ویژگی های آن است. برای Real-time Data حداقل 3 معادل فارسی بیان می شود: داده های بلادرنگ ، داده های زمان واقعی و داده های زمانی حقیقی .
داده های زمان واقعی ، یکی از موضوعات موردتوجه شرکت های بزرگ فراهم کننده راهکارهای مدیریت داده و اطلاعات می باشد. شرکت هایی مثل IBM ، اوراکل و EMC. امروز موضوع داده های زمان واقعی با واژه هایی همچون رایانش زمان واقعی (Real-time Computing) و تحلیل زمان واقعی (Real-time Analytics) پیوند نزدیک خورده است. دلیل این موضوع هم آن است که امروزه در مدیریت داده های عظیم (Big Data) نمی توان بر روی ذخیره سازی داده ها بیش از این تاکید داشت ، زیرا اساسا ذخیره سازی داده ها فلسفه وجودی داده های عظیم محسوب نمی شود لذا می بایست داده ها را در همان بدو تولید ، تحلیل ، پردازش و کاوش کرد. همچون شرکت هایی که وظیفه مانیتورینگ بازار بورس، ارز ، نفت و طلا را بر عهده دارند. این شرکتها برای انجام عملیات مانیتورینگ بازار ، مجبور به تحلیل داده های زمان واقعی هستند. باید دقت نظر داشت که هزینه (زمانی، کارایی و عملکردی) ذخیره سازی و سازماندهی اطلاعات برای چنین شرکتهایی بالا است و کسب و کار اصلی آنها را با ریسک مواجه می کند زیرا این کسب و کار ها به تحلیل های چابک و لحظه به لحظه و بر اساس واقعیت حال حاضر بازار احتیاج دارند. مشابه چنین کارکردهایی را در کسب وکارهای وابسته به شبکه (Network-Intensive Business) همچون بانک ها و اپراتورهای مخابراتی نیز مشاهده میکنیم. در چنین کسب و کارهایی، داده های زمان واقعی و تحلیل آنها حیات سرویس و تداوم کسب و کار را تضمین می کند.
واژه Real-time Data را باید در مقایسه با واژه های زیر بررسی کرد:
· داده های نزدیک به زمان واقعی (Near real-time Data)
· داده های غیر زمان واقعی (Non Real-time Data)
· داده های گرم (Hot Data) در مقابل داده های سرد (Cold Data)
· داده های جریانی (Streaming Data)
· داده های موقتی (Temporal Data)
دیدگاههای خانم اعظم ادهمی خامنه :
زمان واقعی :
بیدرنگ ؛ بلافاصله؛ زمان واقعی (از نظر لغوی)
به فرآیندهایی گفته میشود که پاسخ یک محرک بیدرنگ باشد یا بلافاصله در طی آن یک فرایند و یا یک رویداد رخ میدهد.
در کامپیوترها زمان واقعی که برای عملکرد یک محاسبات صورت میگیرد و نتیجه محاسبه برای ادامه یک فرایند فیزیکی را زمان واقعی میگویند.
دادههایی که مربوط به تغییر در موقعیت اشیاء؛ اطلاعات توصیفی مربوط به اشیاء و هندسه اشیاء در طی زمان میباشد.
دادههای زمان واقعی اشاره به دادههایی است که از تکنولوژی جدید بوجود میآید و اطلاعات دقیقه به دقیقه به برنامههای کاربردی دستگاههای تلفنی، لب تاپ و تبلت منتقل میشود.
داده زمان واقعی، دادهاي است كه ذخيرهسازي يا نگهداري نمیشود و به همان سرعتي كه جمعآوري شده است به كاربر نهايي میرسد.
داده زمان واقعی، طوري طراحي نشده كه پس از جمعآوری، به منظور چكشدن پيش از استفاده نهايي نگه داشته شود.
داده زمان واقعی بدين معنا نيست كه داده فوراً به كاربر نهايي برسد.
در این دادهها بین وقوع اتفاق یا پدیده و پردازش داده با تأخیر زمانی روبرو هستیم.
دادههای که نیاز به پردازش دارند تا بکار گرفته شوند در اینگونه موارد اصطلاح نزدیک به زمان واقعی بسیار مناسب است.
زمان پردازش - رویداد در زمان جاری = داده نزدیک به زمان واقعی.
تمایز میان «نزدیکی زمان واقعی» و «زمان واقعی» مختلف هست . چنانچه تاخیر به نوع و سرعت انتقال بستگی دارد.
تاخیر در نزدیکی زمان واقعی به طور معمول از چند ثانیه تا چند دقیقه میباشد. سیستم زمان واقعی، سیستمی است که درآن زمان نقش مهمی را ایفا میکند. از اين سيستمها در جاهايي كه نياز به دقت عمل و سرعت عمل است، استفاده ميشود. سیستمهای بیدرنگ معمولاً به عنوان یک کنترلکننده در یک کاربرد خاص استفاده میشوند. زمان پارامتر کلیدی در این سیستم عاملها است. عملیات پردزانده و جریان داده در زمان کاملاً مشخصی انجام میگیرد. به عنوان ابزار کنترلی در کاربرد خاص مورد استفاده قرار میگیرد. مانند سیستمهایی که آزمایشهای علمی را کنترل میکنند سیستمهای تصویربرداری پزشکی، سیستمهای کنترل صنعتی، کنترلرهای لوازم خانگی و سیستم های جنگ افزاری. در این سیستمها صحت درستی یک فرآیند نه تنها وابسته به صحت منطقی نیست، بلکه به زمانی که آن اجرا میشود نیز وابسته است. این سیستمها برای آنکه به درستی کار کنند باید پاسخ درست را در فرجه زمانی از پیش تعیین شده بازگردانند.
سیستمهای غیر زمان واقعی محدودیت زمانی ندارند، حتی اگر سرعت پاسخگویی و اجرا مطلوب یا رویدادی ارجح باشد.
کامپیوترها و شبکههایی که از سیستم زمان واقعی استفاده میکنند، بر خلاف کامپیوترهای شخصی و سیستمهای کامپیوتری، که مجری برنامههای غیر-بلادرنگ ازقبیل مرورگر شبکه هستند، از دید کاربر مخفی هستند و طوری به نظر میرسد که این سیستم ها وجود ندارند.
سيستم مديريت پايگاه داده زمان واقعی، سيستمهاي زمان واقعی سيستمهاي سريع با سرعت پاسخگوئي بالا هستند که زمان انجام کليه عمليات نقش مهمي در آنها دارد.
سيستم زمان واقعی در تعامل با دنياي واقعي پاسخ قابل پيش بيني را در قاب زمان ميدهد. ورودي، پردازش و پاسخها همگي از قبل تعريف شده هستند و حد زماني مشخصي دارند و به نحوي بهينه ميشوند که هر حالت ورودي يک حالت خروجي قابل پيشبيني دارد که هميشه در يک زمان و به يک روش اتفاق مي افتد.
و....
دیدگاههای آقای مهندس وحید امیری :
سیستمهای زمان واقعی سیستمهایی هستند که در آنها علاوه بر خروجی صحیحی که برنامه تولید میکند، این خروجی باید در یک زمان معین تولید شود و به اصطلاح برنامه باید در یک زمان مقرر شده خروجی مورد نظر را تولید کند.
معمولا سیستمهای زمان واقعی با توجه به نوع محیط و صورت مسئله به انواع نرم و سخت تقسیم بندی میشوند. در یک سیستم زمان واقعی سخت، اگر خروجی برنامه در زمان تعیین شده تولید نشود خسارتهای فراوانی به بار میآید و این امر میتواند به یک فاجعه منجر شود. از نمونه مسئلههایی که آن را در نوع سیستمهای زمان واقعی سخت قرار میگیرد میتوان به سیستمهای کنترل نیروگاهها، سیستمهای کنترل خودکار وسائل نقلیه(نظیر هواپیماها، خودروها و ...) و سیستمهای نظامی اشاره کرد. به عنوان راهحلی برای این مسائل، معمولا از سیستمهای Embedded و سیستمعاملهای زمان واقعی استفاده میکنند. سیستمهای Embedded، سیستمهایی هستند که برای یک هدف خاص ساخته میشوند و برای انجام آن هدف نیز بهینه میشوند. این سیستمها شبیه به یک سیستم کامپیوتری دارای پردازنده، حافظه اصلی، حافظه ذخیره سازی و ورودی/خروجیهای متناسب میباشند. سیستمعاملهای زمان واقعی نیز سیستمعاملهایی هستند مشابه سیستمعاملهای همه منظوره با این تفاوت که بدلیل زمان واقعی بودن محیط، معمولا زمانبندی، مدیریت منابع و تخصیص آنها به پردازشها و دیگر مولفههای موثر در اجرای برنامهها از الگوریتمهای مناسب برای سیستمهای زمان واقعی پیروی میکنند.
در طرف دیگر سیستمهای زمان واقعی نرم قرار دارد. در این نوع، مانند نوع سخت، سیستم به زمان پاسخ معین شده حساس نیست و اگر خروجی برنامه بعد از زمان معین شده نیز ایجاد شود نیز میتواند مورد استفاده قرار بگیرد. معمولا در سیستمهای زمان واقعی نرم عنوان میشود در صورت رد شدن از زمان معین، دچار هزینه میشویم. سیستمهای چندرسانهایی برخط، بازیهای رایانهای برخط و سیستمهای تحلیل دادههای کلان را میتوان به عنوان مثالهایی از سیستمهای زمان واقعی نرم برشمرد. استفاده از سیستمهای توزیع شده، روشهای برنامه نویسی همروند و موازی از جمله راهحلهای متداول این مدل از مسائل سیستمهای زمان واقعی محسوب میشوند.
در محیطهای کلان داده بدلیل ویژگیهای این محیط (حجم، تنوع و نرخ تولید داده) پیچیدگیهای رسیدن به زمان پاسخی نزدیک به زمان واقعی بسیار بیشتر بوده و به یکی از چالشهای پیش روی دانشمندان علم داده قرار گرفته است. ابزارهایی نیز که امروزه در محیط کلان داده مطرح میشود نیز در رسیدن به این امر کمک کننده خواهد بود.
جمع بندی مصطفی امینی
از جمله مهم ترین خصیصه های داده های زمان واقعی این است که این نوع از داده ها به "مهلت زمانی (Deadline)" وابستگی شدید دارند. این وابستگی هم مربوط به اعتبار خود داده ها است و هم نتایج حاصل از تحلیل آنها. یعنی مفید بودن، معتبر بودن و اثربخش بودن داده های زمان واقعی شدیدا به "یک بازه زمانی کوتاه از قبل تعریف شده و مورد توافق" وابسته است. همچنین یکی دیگر از ویژگی های داده های زمان واقعی ، "میزان تحمل پذیر بودن تاخیر" است. آنچه که داده های زمان واقعی را از داده های نزدیک به زمان واقعی (Near Real-time Data) مستقل می کند این است که در داده های زمان واقعی ، میزان تحمل پذیری تاخیر برابر صفر است زیرا عدم وجود تاخیر در چنین داده هایی یک موضوع حیاتی (Critical Subject) است همچون یک هواپیما یا نیروگاه هسته ای اما در داده های نزدیک به زمان واقعی ، میزان تحمل پذیری در تاخیر ، یک عدد مورد توافق می باشد زیرا این امر یک موضوع مهم (Important Subject) محسوب می شود و نه حیاتی! . همچنین داده های زمان واقعی نوع خاصی از داده های گرم و داده های جریانی محسوب می شوند.
شباهت داده های زمانی واقعی با داده های موقتی (Temporal Data) در این است که هر دو گونه داده ها ، داده هایی هستند که حساس به زمان (Time-Intensive) می باشند اما با این تفاوت که داده های زمان واقعی جژء داده های پیوسته و داده های موقتی جزء داده های گسسته محسوب می شوند. همچنین داده های زمان واقعی نوعی داده جریانی (Streaming data) محسوب می شوند یعنی در حقیقت در پردازش داده های زمان واقعی ، جریان های داده ای (Data Stream) پردازش می شوند. از راهکارهای سازمانی مبتنی بر داده های زمان واقعی عبارتند از:
- هوش تجاری بلادرنگ (Real-time Business Intelligence)
- مانیتورینگ (اعم از مانیتورینگ شبکه های اجتماعی تا مانیتورینگ شبکه های مخابراتی)
- کشف تقلب
- کشف حمله های امنیتی به سیستم های تحت وب
- مدیریت کیفیت خدمات در راهکارهای IOT
این نشست در ساعت 18:30 به پایان رسید.
فایل پاورپوینت ارائه شده توسط اساتید به آدرس:
https://www.slideshare.net/hershadir قابل دسترسی است.