فيديو: ايه الفرق بين ال Big Data و ال Data Science و ال Data Analysis 2024
الاعتبار الرئيسي عند القيام بمشروع البيانات الضخمة هو المبلغ المتوقع في الوقت الحقيقي وغير الحقيقي اللازم لتنفيذ مبادرتكم. وكثيرا ما تكون البيانات الضخمة عن الأشياء غير ممكنة لأن التكنولوجيا لم تكن متقدمة بما فيه الكفاية أو أن التكلفة كانت باهظة. التغيير الكبير يحدث مع البيانات الكبيرة هو القدرة على الاستفادة من كميات هائلة من البيانات دون كل البرمجة المعقدة المطلوبة في الماضي.
العديد من المنظمات في نقطة التحول من حيث إدارة كميات كبيرة من البيانات المعقدة. وستساعد مقاربات البيانات الضخمة في الحفاظ على التوازن في الميزانيات بحيث لا تتخطى الشركات حجم الحافة نظرا لتغير حجم البيانات وتنوعها وسرعتها. وقد واجهت الشركات وقتا صعبا في إدارة كميات متزايدة من البيانات التي تحتاج إلى إدارة بسرعات عالية.
كان على المنظمات أن تستقر لتحليل مجموعات فرعية صغيرة من البيانات التي غالبا ما تفتقر إلى معلومات هامة للحصول على صورة كاملة يمكن أن تكشف عنها البيانات. ومع تطور تكنولوجيات البيانات الكبيرة ونشرها، ستتمكن الشركات من تحليل البيانات بسهولة أكبر واستخدامها لاتخاذ القرارات أو اتخاذ الإجراءات اللازمة.
في الوقت الحقيقي جوانب البيانات الكبيرة يمكن أن تكون ثورية عندما تحتاج الشركات إلى حل مشاكل كبيرة. ما هو التأثير الذي يمكن أن تتعامل فيه المنظمة مع البيانات التي يتم بثها في الوقت الفعلي؟ بشكل عام، هذا النهج في الوقت الحقيقي هو الأكثر أهمية عندما يكون الجواب على مشكلة الوقت حساسة والأعمال الحاسمة. قد يكون هذا مرتبطا بتهديد لشيء مهم مثل الكشف عن أداء معدات المستشفى أو توقع مخاطر الاختراق المحتملة.
تعرض القائمة التالية أمثلة عن متى ترغب الشركة في الاستفادة من هذه البيانات في الوقت الفعلي للحصول على ميزة سريعة:
-
رصد استثناء مع معلومات جديدة مثل الاحتيال / الذكاء
-
رصد خلاصات الأخبار ووسائل التواصل الاجتماعي لتحديد الأحداث التي قد تؤثر على الأسواق المالية، مثل رد فعل العميل على إعلان منتج جديد
-
تغيير موضع إعلانك خلال حدث رياضي كبير استنادا إلى تيارات تويتر في الوقت الفعلي
-
توفير قسيمة للعميل على أساس ما اشترى من نقطة البيع
أحيانا تدفق البيانات تأتي في سريع حقا، ولا تشمل مجموعة واسعة من المصادر، وأحيانا مجموعة واسعة موجودة، وأحيانا هو مزيج من الاثنان.
السؤال الذي تحتاجه لتسأل نفسك إذا كنت تتحرك إلى الوقت الحقيقي هو هذا: هل يمكن حل هذه المشكلة مع قدرات إدارة المعلومات التقليدية أو هل تحتاج إلى قدرات أحدث؟فهل سيكبر حجمنا أو سرعةنا على أنظمتنا؟ في كثير من الأحيان هو مزيج من الاثنين.
لذلك، إذا كنت بحاجة إلى قدرات الوقت الحقيقي، ما هي متطلبات البنية التحتية لدعم هذا؟ تسلط القائمة التالية الضوء على عدد قليل من الأشياء التي تحتاج إلى التفكير فيما يتعلق بإمكانية النظام لاستيعاب البيانات ومعالجتها وتحليلها في الوقت الفعلي:
-
الكمون المنخفض: الكمون هو مقدار الفاصل الزمني الذي يمكن الخدمة من تنفيذ في بيئة. تتطلب بعض التطبيقات وقت استجابة أقل، مما يعني أنها تحتاج إلى الاستجابة في الوقت الفعلي. سيتطلب بث في الوقت الفعلي وقت استجابة منخفض. لذلك عليك أن تفكر في حساب الطاقة وكذلك قيود الشبكة.
-
قابلية التوسع: قابلية التوسع هي القدرة على الحفاظ على مستوى معين من الأداء حتى في ظل زيادة الأحمال.
-
تعدد الاستخدامات: يجب أن يدعم النظام كل من بيانات البيانات المنظمة وغير المنظمة.
-
تنسيق أصلي: استخدم البيانات في شكلها الأصلي. التحول يأخذ الوقت والمال. قد تكون القدرة على استخدام فكرة معالجة التفاعلات المعقدة في البيانات التي تؤدي إلى أحداث تحويلية.
الحاجة إلى معالجة كميات متزايدة من البيانات المتباينة هي واحدة من العوامل الرئيسية التي تدفع اعتماد الخدمات السحابية. نموذج السحابة واسع النطاق وموزع.