جدول المحتويات:
فيديو: Statistical Programming with R by Connor Harris 2025
ميزة واحدة مريحة جدا من ggplot2 هو مجموعة من وظائف لتلخيص البيانات الخاصة بك R في المؤامرة. وهذا يعني أنك غالبا لا تضطر إلى تلخيص البيانات الخاصة بك مسبقا. على سبيل المثال، ارتفاع الأشرطة في الرسم البياني يشير إلى عدد الملاحظات من شيء لديك في البيانات الخاصة بك.
الملخص الإحصائي لهذا هو لحساب الملاحظات. ويشير الإحصائيون إلى هذه العملية على أنها بينينغ، والإحصاء الافتراضي ل geom_bar () هو stat_bin ().
على غرار الطريقة التي تحتوي كل جيوم على حالة افتراضية مرتبطة بها، يكون لكل إحصائية أيضا جيوم افتراضي.
لذلك، هذا يطرح السؤال: كيف تقرر ما إذا كان استخدام جيوم أو قانون؟ من الناحية النظرية لا يهم ما إذا كنت تختار جيوم أو القانون الأساسي أولا. في الممارسة العملية، ومع ذلك، فإنه غالبا ما يكون بديهية للبدء مع نوع من المؤامرة أولا - وبعبارة أخرى، تحديد جيوم. إذا كنت تريد بعد ذلك إضافة طبقة أخرى من الملخص الإحصائي، استخدم قانونا.
في هذه المؤامرة، استخدمت نفس البيانات أولا لإنشاء سكاتيربلوت مع geom_point () ثم قمت بإضافة خط ناعم مع stat_smooth ().
نلقي نظرة على بعض الأمثلة العملية لاستخدام وظائف ستات.
ستات | دسكريبتيون | ديفولت جيوم |
---|---|---|
stat_bin () | يحسب عدد الملاحظات في صناديق. | geom_bar () |
stat_smooth () | يخلق خطا سلسا. | geom_line () |
stat_sum () | يضيف القيم. | geom_point () |
stat_identity () | لا موجزة. البيانات المؤامرة كما هو. | geom_point () |
stat_boxplot () | يلخص البيانات الخاصة بمؤامرة مربع وخفيفة. | geom_boxplot () |
كيفية بن البيانات في ggplot2 |
لقد سبق لك أن رأيت كيفية استخدام stat_bin () لتلخيص البيانات الخاصة بك في صناديق، لأن هذا هو القانون الافتراضي geom_bar (). وهذا يعني أن السطرين التاليين من الشفرة ينتجان مؤامرات متطابقة: >> غبلوت (الزلازل، إيس (x = العمق)) + geom_bar (بينويدث = 50)> غبلوت (الزلازل، إيس (x = العمق)) + stat_bin بينويدث = 50)
كيفية تسهيل البيانات R في ggplot2
حزمة ggplot2 أيضا يجعل من السهل جدا لإنشاء خطوط الانحدار من خلال البيانات الخاصة بك. يمكنك استخدام الدالة stat_smooth () لإنشاء هذا النوع من السطر.
الشيء المثير للاهتمام حول stat_smooth () هو أنه يجعل من الانحدار المحلي افتراضيا. R لديه العديد من الوظائف التي يمكن القيام بذلك، ولكن ggplot2 يستخدم الدالة لووس () للانحدار المحلي. وهذا يعني أنه إذا كنت ترغب في إنشاء نموذج الانحدار الخطي يجب أن أقول st_smooth () لاستخدام وظيفة أكثر سلاسة مختلفة. يمكنك القيام بذلك باستخدام وسيطة الأسلوب.
لتوضيح استخدام أكثر سلاسة، ابدأ بتشكيل مبعثر للبطالة في مجموعة بيانات لونغلي: >> غبلوت (لونغلي، إيس (x = يار، y = إمبلويد)) + geom_point ()
نيكست ، إضافة سلاسة.هذا بسيط مثل إضافة stat_smooth () إلى سطر التعليمات البرمجية. >> غبلوت (لونغلي، إيس (x = يار، y = إمبلويد)) + + geom_point () + stat_smooth ()
وأخيرا، أخبر stat_smooth لاستخدام نموذج الانحدار الخطي. يمكنك القيام بذلك عن طريق إضافة طريقة الوسيطة = "لم".
غبلوت (لونغلي، إيس (x = يار، y = إمبلويد)) + + geom_point () + stat_smooth (ميثود = "لم")
كيف تخبر ggplot2 بترك بياناتك غير مستهلكة
لا تريد ggplot2 لتلخيص البيانات الخاصة بك في المؤامرة. ويحدث ذلك عادة عندما تكون بياناتك موجزة مسبقا مسبقا أو عندما يجب رسم كل سطر من إطار البيانات بشكل منفصل. في هذه الحالات، تريد أن تخبر ggplot2 أن تفعل شيئا على الإطلاق، و ستات للقيام بذلك هو stat_identity ().