جدول المحتويات:
- الأساسيات
- هل هناك حد لعدد الأبعاد؟
- كيف يجب أن تختار المستويات في التسلسل الهرمي؟
- هياكل قواعد البيانات الفيزيائية في مدب
فيديو: Gradient descent, how neural networks learn | Deep learning, chapter 2 2025
قواعد البيانات المتعددة الأبعاد تخرج من اتفاقيات أسلافهم العلائقيين وتنظم البيانات بطريقة تفضي إلى تحليل متعدد الأبعاد. ومن أجل فهم قواعد البيانات متعددة الأبعاد، يجب عليك أولا فهم أساسيات الوظائف التحليلية التي يتم إجراؤها مع البيانات المخزنة فيها.
تم بناء تحليل متعدد الأبعاد حول بعض مفاهيم تنظيم البيانات البسيطة - وتحديدا الحقائق والأبعاد:
-
حقائق: A الواقع هو مثال على حدوث معين أو حدث معين وخصائص الحدث المخزنة في قاعدة بيانات. هل بيعت ساعة إلى أحد العملاء بعد ظهر يوم الجمعة الماضي؟ هذه حقيقة. هل تلقى متجرك شحنة من 76 صنف من حلقات أمس من مورد معين؟ هذه حقيقة أخرى.
-
الأبعاد: A ديمنزيون هو وصف رئيسي، فهرس، يمكنك من خلاله الوصول إلى الحقائق وفقا للقيمة (أو القيم) التي تريدها. على سبيل المثال، يمكنك تنظيم بيانات المبيعات وفقا لهذه الأبعاد: الوقت والعميل والمنتج.
>
الأساسيات
في هذه الأمثلة البسيطة، يمكنك تنظيم وعرض بيانات المبيعات كمصفوفة ثلاثية الأبعاد، يتم فهرستها حسب الوقت والزبون ومكونات المنتج:
-
في تشرين الأول (أكتوبر) 2008 (البعد الزمني)، اشترى العميل أ (البعد العميل) حلقات الصفوف (بعد المنتج) - 79 منها مقابل 8 دولارات أمريكية، 833.
-
في عام 2007 (البعد الزمني)، تم شراء العميل أ (بعد العميل) العديد من المنتجات المختلفة (البعد المنتج) - ما مجموعه 3، 333 وحدة مقابل 55 $، 905 (الحقائق).
لاحظ الفرق الدقيق بين طريقة استخدام الأبعاد في هذين المثالين. في أول واحد، البعد الوقت يتعلق شهر؛ ويتصل بعد العميل بعميل محدد؛ و البعد المنتج هو منتج معين.
في المثال الثاني، ومع ذلك، فإن الوقت هو لمدة سنة، وليس شهر. العميل لا يزال هو نفسه (عميل فردي). والمنتج هو لخط الانتاج بأكمله.
يدعم التحليل المتعدد الأبعاد فكرة التسلسل الهرمي في الأبعاد. على سبيل المثال، يمكنك تنظيم الوقت في تسلسل هرمي من السنة → الربع → الشهر. يمكنك عرض الحقائق (أو توحيد الحقائق) في قاعدة البيانات في أي واحد من هذه المستويات: حسب السنة أو الربع أو الشهر.
وبالمثل، يمكنك تنظيم المنتجات في التسلسل الهرمي لعائلة المنتج → نوع المنتج → منتجات محددة. قد تكون حلقات الصف نوع من المنتجات؛ "حلقة الطبقة، الطراز الحديث، الحجر الجزع" قد يكون منتج معين.وعلاوة على ذلك، فإن حلقات الصف، والساعات، وحلقات أخرى، وغيرها من البنود جميعا نشمر في عائلة منتجات المجوهرات.
هل هناك حد لعدد الأبعاد؟
نظريا، يمكن أن يكون لديك العديد من الأبعاد في نموذج متعدد الأبعاد الخاص بك حسب الضرورة. بيد أن السؤال موجود دائما على ما إذا كان منتج قاعدة البيانات المتعددة الأبعاد يمكن أن يدعمها. ولكن هنا سؤال أكثر أهمية - حتى إذا كان المنتج يسمح لعدد معين من الأبعاد (15، على سبيل المثال)، هل من المنطقي لخلق نموذج من هذا الحجم؟
يجب أن تعمل بشكل وثيق مع المستخدمين لتحديد ما إذا كان عدد الأبعاد يجعل الحل أكثر تعقيدا - وبالتالي يحد من عدد المستخدمين - أو يحسن سهولة الاستخدام - وبالتالي توسيع عدد المستخدمين.
يمكنك، على سبيل المثال، إضافة الجغرافيا إلى قائمة الأبعاد التي تحتوي على الوقت والعملاء والمنتج بحيث يمكنك مشاهدة وتنظيم الحقائق وفقا لأقاليم المبيعات والحالات والمدن والمتاجر المحددة.
كيف يجب أن تختار المستويات في التسلسل الهرمي؟
المستويات في التسلسل الهرمي تمكنك من أداء دريل-دون فونكتيوناليتي. ومن خلال وجود مستويات متعددة ضمن تسلسل هرمي، يمكنك الحصول بسرعة على إجابات لأسئلتك بسبب المعلومات التي تم إعدادها في كل من تلك المستويات المحددة، حتى أن المعلومات هي مجرد انتظار لطلبات البحث الخاصة بك.
لأن قواعد البيانات متعددة الأبعاد لها هياكل صلبة إلى حد ما مبنية حول قبل - حساب من الحقائق (إنشاء وتخزين المجاميع في قاعدة البيانات، بدلا من أداء التجميع الزمني للتقارير والحساب) والمزيد من الأبعاد لديك والمزيد من المستويات في كل بعد لديك، وزيادة متطلبات التخزين الخاصة بك وأطول الخاص بك بناء أو مرات التحميل.
هياكل قواعد البيانات الفيزيائية في مدب
على الرغم من أن جميع منتجات مدب تقريبا تقوم على مفهوم الحقائق والأبعاد والتسلسل الهرمي، إلا أن أحدا لم يخرج بتعريف موحد من قبل مدب. وفي العالم العلائقي، كان عدم توحيد المعايير أيضا مشكلة إلى حد ما، لا سيما فيما يتعلق بالميزات المضافة إلى القيمة، مثل القيود والإجراءات المخزنة.
ومع ذلك، فقد كان من السهل نسبيا تصدير أو تفريغ الهيكل المسطح الأساسي-الصف-العمود إلى ملف مسطح من نوع ما ثم إعادة تحميله في منتج آخر ردبس.
في عالم مدب، اتخذ الباعة مجموعة متنوعة من النهج المختلفة لتمثيل منتجاتهم المادية للبيانات. إنهم جميعا يبحثون عن طرق للتغلب على مشاكل التخزين والتعقيد الناجمة عن أعداد كبيرة من الأبعاد (على سبيل المثال، أكثر من 15) ومستويات عميقة من التسلسلات الهرمية (على سبيل المثال، 20 مستوى عميق).
عندما تقوم بتقييم المنتجات، لا تتورط في القلق بشأن تقنيات التخزين الفعلي: تأكد فقط من أن التمثيلات المنطقية التي تأتي مع المنتجات (مثل التسلسلات الهرمية والمستويات والحقائق) يمكن أن تلبي احتياجات نشاطك التجاري. القضاء على المنتجات التي تبدو غريبة أو التي، على سبيل المثال، نموذج التسلسل الهرمي الذي لا يبدو مناسبا تماما لبياناتك.
ثم، بعد أن تجد المنتجات التي تبدو لتناسب عملك، ركلة الإطارات قليلا (إذا جاز التعبير) لنرى كيف يعملون داخل.
