درگاه پرداخت اختصاصی پی‌ پینگ
نمودار خطی

نمودار خطی چیست؟

تیم محتوایی پی‌پینگ در علم داده ها ۱۴۰۰/۰۴/۲۳

 

موفقیت در بسیاری از پروژه های تصویرسازی داده‌ها وابسته به درک یکپارچه از مفاهیم پایه‌ای است. بنابراین خواه این مفاهیم همانند گراف ها یا نمودار های خطی را برای بار اول شنیده باشید یا نه، خواندن و تقویت این اصول پایه‌ای و جست‌و‌جو به دنبال منابع مرتبط برای به اشتراک گذاشتن با دیگران امری مفید خواهد بود.

نمودار های خطی یا گراف های خطی بهترین روش برای نشان دادن تغییرات مقادیر یک چیز در طول زمان یا مقایسه میان میزان تغییرات چند چیز در طول زمان نسبت به یکدیگر است. هر وقت کلمه کلیدی «در طول زمان» به گوش تان خورد، این می‌تواند نشانه ای از این باشد که باید نمودار خطی را برای داده‌های خود در نظر بگیرید.

گراف های خطی، نمودار هایی متداول و مؤثر هستند. دلیل این امر سادگی این نمودار ها، سهولت در درک آن‌ها و کارآمدی این نمودار ها است. بیشترین کاربرد این نموداره در موارد زیر است:

– مقایسه مقادیر زیادی داده به صورت یکباره

– نشان دادن تغییرات و روند تحول در طول زمان

– قرار دادن توضیحات زمینه‌ای و یادداشت‌های مهم برای داده‌ها

– نشان دادن داده‌های پیش‌بینی و دارای عدم قطعیت

– برجسته کردن تغییرات درون و بین سری داده‌ها

از سویی دیگر این نمودار برای موارد زیر بهترین گزینه محسوب نمی شود:

– نشان دادن کمیت چیزها

– برای داده‌های گروه بندی شده (Categorical)

– مقایسه‌های جزء به کل

– نشان دادن مجموعه داده‌های پراکنده

در این مقاله در خصوص نحوه استفاده از نمودار خطی و چگونگی ایجاد نموداری که اطلاعات معنادار و زمینه‌ای به مخاطب ارائه کند صحبت خواهیم کرد. در ادامه به برخی سؤالات متداول در خصوص نمودار های خطی پاسخ خواهیم داد. نمودار های خطی زیرشاخه های دیگری مانند گراف نمایش شیب و گراف ناحیه ای را نیز در بر می‌گیرد که در مقالاتی مجزا به آن‌ها خواهیم پرداخت. 

نمودار خطی چه کاری انجام می دهد؟

خطوط نمودار خطی را به عنوان تاریخچه ای از داده‌ها در نظر بگیرید.

– اول: ما مقدار چیزی را که می‌خواهیم در نقاط مختلف زمانی رهگیری کنیم، به کمک این نوع گراف مورد سنجش قرار می دهیم. به طور مثال در پایان هر ماه فروشگاه ما می‌خواهد میزان پولی که از فروش به دست آورده‌ایم را ثبت کند.

– وقتی تعداد زیادی از این فرایندهای سنجش به انجام رسید ما این نقاط را بر روی یک گراف قرار می‌دهیم و بعد با یک خط این نقاط را به هم وصل می‌کنیم تا اوج و فرود یا ثابت ماندن تغییرات در طول زمان بهتر نمایان شود.

 کاربرد های نمودار خطی

اما این تمام کاربرد نمودار خطی یست.

علاوه بر رسم این خط می‌توانیم اطلاعات زمینه‌ای مهم دیگری را نیز به این نمودار ها بیفزاییم. می‌توانیم از برچسب ها۷ علایم و یا توضیحات درون نمودار برای گویاتر شدن آن استفاده کنیم. هم چنین می‌توانیم خطوط مرجع و نواحی مختلفی را در نمودار تعیین نیم. حتی می‌توانیم نقاطی را به صورت پیش‌بینی روی این نمودار تعیین کنیم و تمایز میان داده‌های واقعی و داده‌های پروجکت شده را با تغییر ظاهر خطوط و علایم نمودار مشخص کیم. به طور مثال می‌توان نمودار زیر را به عنوان نمونه‌ای از این نوع علایم و توضیحات در نظر گرفت.

داده‌های گردآوری شده از میزان فروش همان‌طور که می‌بینید هم چنان در نمودار با خط سیاه پررنگ مشخص است اما در کنار آن می‌توانیم داده‌های زمینه‌ای را نیز مشاهده کنیم. ناحیه مرجع خاکستری رنگ نشان می‌دهد که بازه مجموع فروش ماهانه چقدر است و مقادیر خاص مرتبط با آن را نیز در برچسب‌ها نشان داده ایم.

خط سبز نشان می‌دهد که هدف نهایی فروش ما چقدر است، به این ترتیب به سادگی می‌توان مقادیر مطلوب فروش را در هر ماه مشخص نمود.

هم چنین برای پرهیز از شلوغ شدن بیش از حد نمودار، برچسب داده‌ها و بیشتر علایم مربوط به هر نقطه از این خط نیز حذف شده اند. تنها علایم ماه هایی که در آن رکورد کمترین و بیشترین فروش ثبت شده باقی‌مانده اند چرا که این دو نقطه برای داستانی که می‌خواهیم به کمک این نمودار تعریف کنیم مهم هستند.

هم چنین نمودار خط چین شده در ادامه نشان دهنده میزان فروش پیش بینی شده در سه ماه آینده است. توضیحات مربوط به نقاط کلیدی زمانی نشان دهنده دلیل اعداد به دست آمده در نمودار، فعالیت‌هایی که در واکنش به این دستاوردها صورت گرفته است، و انتظارات ما است.

برچسب داده ها در نمودار خطی

یادمان باشد که گراف های خطی به دنبال تأکید بر تغییر مقادیر سنجش شده در طول زمان یا تغییر یک متغیر مستقل خاص هستند. می‌توانیم از فضای سفید داخل نمودار برای قرار دادن توضیحات مفید برای کمک به مخاطب به منظور درک چرایی اهمیت این تغییرات خاص استفاده کنیم.

چه نوع داده‌هایی را می‌توان در یک گراف خطی استفاده کرد؟

یک گراف خطی معمولی دارای داده‌ های پیوسته در طول محور افقی و عمودی است. محور عمودی معمولاً نشان دهنده مقدار متغیری است که در حال سنجش آن هستیم. هم چنین محور افقی هم اغلب نشان دهنده زمان سنجش متغیر، خواه به صورت کرونولوژیک و یا خواه بر اساس برخی متغیرهای مستقل تعیین شده است. در عین حال که برخی نمودار های خطی از داده‌های پیوسته روی محور x استفاده نمی‌کنند (به ویژه نمودار های شیب تغییرات و دیاگرام های مختصات موازی که نمونه‌هایی خاص از گراف خطی به حساب می آیند) اما آنچه قطعاً نمی‌توان در محور x استفاده کرد داده‌هایی است که رابطه معناداری با دسته بندی های نشان داده شده ندارد.

فرض کنیم فهرستی از اطلاعات شش ماه اول سال ۲۰۲۰ در اختیار داریم. اینکه ترتیب ماه ها را به هم بزنیم تصمیمی اشتباه است چون این داده‌ها دارای پیوستی و یک نظم درونی هستند. اطلاعات ماه ژانویه ۲۰۲۰ به فوریه ۲۰۲۰ ختم می‌شود و همین‌طور تا ماه های بعدی ادامه می یابد.

هم چنین در نظر بگیرید که فهرستی از انواع محصولات در اختیار داریم: مثلاً سیب، گلابی، لیمو، خرما، انگور. برخلاف فهرست مربوط به ماه ها، در اینجا می‌توانید اطلاعات را به هر ترتیبی که مایل هستید مرتب کنید چون اطلاعات دارای پیوستگی نیستند. می‌توانید به صورت الفبایی، بر اساس اندازه، رنگ یا به صورت تصادفی آن‌ها را بچینید و اشکالی هم ندارد چرا که هیچ ترتیب درونی در این داده‌ها وجود ندارد و پیوستگی هم در آن‌ها نیست. این داده‌ها را گروه بندی شده یا Categorical می نامیم.

گروه بندی داده های نمودار خطی

نمودار های خطی تنها زمانی معنا دارند که ارتباطی معنا دار میان نقاط پی در پی در طول یک خط وجود داشته باشد. بنابراین به طور مثال فروشنده مواد غذایی می‌تواند از نمودار خطی برای نشان دادن اطلاعات فروش محصولات در ماه های مختلف استفاده کند اما استفاده از نمودار خطی برای نمایش تفاوت فروش بین هر گروه از محصولات توصیه نمی شود. بهتر است برای این کار از نمودار میله ای استفاده کنیم.

چند خط مختلف را می‌توان در یک نمودار قرار داد؟

بسیاری در دنبال کردن بیش از چهار یا پنج موضوع مختلف به صورت همزمان مشکل دارند بنابراین بهتر است این نکته را در نمودار های خود در نظر بگیرید. اگر چاره‌ای به جز نشان دادن چند روند و چند خط در نمودار خود ندارید، سعی کنید با ایجاد تفاوت رنگی، تفاوت در ضخامت خطوط و برچسب گذاری، تمرکز مخاطب را به سمت نقاط یا خطوط مهم‌تر ببرید.

تفاوت رنگ ها در نمودار خطی

گراف فوق نشان دهنده ارزش داده‌های پنج سال اخیر نرخ سالانه دیابت برای بیماران در یک مرکز درمانی و نیز نرخ ۱۲ مرکز دیگر در همان منطقه است. از آنجا که احتمالاً مهم‌ترین چیز برای ما در این گراف همان مرکز درمانی خاص است، از رنگ ها، ضخامت خط، و برچسب گذاری برای تمرکز بر آن مرکز خاص و هم چنین نمودار میانگین کل منطقه استفاده می‌کنیم و در عین حال مقادیر دیگر مراکز را نیز در این نمودار قرار می دهیم.

آیا محور y در نمودار خطی باید از صفر شروع شود؟

وقتی به نمودار خطی نگاه می‌کنیم بیشتر از اینکه ارتفاع خطوط را نسبت به محور x بررسی کنیم به مقایسه خطوط با هم می پردازیم. به طور طبیعی نمودار های خطی بیشتر برای نشان دادن تغییر مقادیر در طول زمان به کار می‌روند و نه برای بررسی مقادیر دقیق در هر نقطه معین.

بنابراین گراف های خطی لزوماً نباید از نقطه صفر شروع شوند اما در بیشتر موارد همچنان توصیه می‌شود تا از نقطه صفر شروع کنیم. برای مخاطب اگر نمودار از صفر شروع شود کمتر گیج‌کننده خواهد بود چرا که به طور نرمال انتظار دارد که نموداری که برای بار اول می‌بیند از صفر شروع شود. باید دلیل قانع کننده ای برای تغییر وضعیت مخالف انتظار مخاطب داشته باشیم.

در اینجا به بررسی چند حالت خاص می‌پردازیم که در آن ممکن است شروع کردن خط پایه از صفر چندان بهینه نباشد.

الف) وقتی که بازه سنجش ما کوچک است اما فاصله از حداقل مقدار این سنجه ها تا صفر مقدار زیادی باشد.

اگر محور y در این حالت تا صفر امتداد داشته باشد هر گونه نوسان معنا دار در این باز قابل ادراک نخواهد بود. همان‌طور که تصویر زیر نیز این معنا را نشان می دهد.

نوسان در گراف خطی

ب) وقتی ارتباط با صفر معنادار نباشد

در برخی دیگر از مقیاس ها مثل وقتی که از واحد فارنهایت برای دما استفاده می‌کنیم مکان نقطه صفر تا حدودی قراردادی است (۵۰ درجه فارنهایت نسبت به ۲۵ درجه فارنهایت دوبرابر گرم تر نیست) بنابراین اگر هیچ نقطه از داده‌ها به صفر نرسد نباشد الزاماً نقطه صفر را در خط پایه نمودار قرار دهیم. گراف ما باید شامل بازه ای از مقادیر منطقی باشد و بیشترین اطلاعات زمینه‌ای را به مخاطب بدهد.

بازه گراف

ج) وقتی برخی از مقادیر منفی باشند

ممکن است در نمودار ها لازم باشد که یک خط افقی را به عنوان خط مرجع برای صفر در نظر بگیریم اما هیچ سری داده‌ای از گراف ما خطوط محور نمودار را قطع نکنند. در این شرایط ترجیحاً باید یک مقدار حداقلی برای کمترین مقدار محور y را در نظر بگیریم که کمتر از حداقل مقدار سنجش شده توسط داده‌های ما باشد تا در نتیجه خط پایه‌ای ما تبدیل به خط مرزی داده‌ها شود.

مقادیر منفی در گراف

نکته: در شرایطی که نمودار خطی دارای یک خط پایه‌ای غیرصفر باشد بسیار مهم است که این فکت به اطلاع بیننده برسد تا در بررسی داده‌ها دچار سردرگمی نشوند.

چه میزان فضا باید در بالا و پایین گراف خالی گذاشته شود؟

پاسخ مشخص به این سؤال بسته به نمودار خطی ای که ایجاد می‌کنید متفاوت است. برای شروع بهتر است بازه مورد نظرتان را از کمترین مقدار تا بیشترین مقدار برابر با ۷۰ الی ۸۰ درصد از فضای عمودی موجود در گراف در نظر بگیرید و مقدار فضای خالی بالا و پایین نمودار یکسان باشد.

از اینجا به بعد می‌توانید بازه محورها را تغییر دهید و خط یا خطوط موجود در گراف را به نحوی مکان یابی کید که مطابق با نیازهای خاص شما باشد. شیب نسبی خطوط شما در این شرایط تغییر نخواهد کرد بنابراین می‌توانید به بهترین شکل بازه محورها را انتخاب کنید و این به شما امکان می‌دهد تا اعداد رند برای برچسب هر محور انتخاب کنید و مقدار قابل قبول فضای خالی در نمودار را برای برچسب داده‌ها و توضیحات در نظر بگیرید. در صورت لزوم نیز عرض کافی برای نشان دادن خطوط مرجع مثل میزان هدف یا مقادیر پیش‌بینی شده را نیز لحاظ کنید که ممکن است بزرگ‌تر یا کوچک‌تر از کمترین یا بیشترین مقدار سنجش شده باشد.

در هر حالت مهم است که دلیل قانع کننده و فکر شده‌ای برای نحوه ارائه داده‌ها داشته باشید که پیام شما توسط مخاطب به خوبی درک شود.

منبع:

https://www.storytellingwithdata.com/blog/2020/3/24/what-is-a-line-graph/#zero=

 

 

 

مطالب پیشنهادی


ارسال نظر

نام
نام خود را وارد کنید
ایمیل
ایمیل خود را وارد کنید