درگاه پرداخت اختصاصی پی‌ پینگ
داده های کیفی چه هستند و چگونه می توان آن ها را تصویرسازی کرد؟

کلمات هم داده هستند

تیم محتوایی پی‌پینگ در علم داده ها ۱۴۰۰/۰۴/۲۹

 یکی از موضوعاتی که شرکت کنندگان در کارگاه های آموزشی تصویرسازی با داده‌ها اغلب با آن دست به گریبان هستند چالش کار با داده های کیفی، در مقابل داده‌های کمی است. وقتی یک ارائه بصری از داده‌ها را تصور می‌کنید اغلب داده‌ها به صورت عددی در ذهن می آید: درصدها، تعدادها، زمان ها و امثال آن. کار با این نوع داده‌ها نسبتاً ساده‌تر است. مقیاس بندی این داده‌ها هم بهتر صورت می گیرد. ما برای ترکیب یا جداسازی این داده‌ها اطلاعات بیشتری در اختیار داریم. بازه ها و داده‌های خارج از محدوده هم با سهولت بیشتری پیدا می شود. در عین حال می‌توانیم روند های آتی را نیز پیش‌بینی کنیم.

با این همه می‌دانیم که همیشه نمی‌شود فقط با اعداد سر و کار داشت.

در برخی حوزه های کاری یا پروژه های خاص جمع آوری و تحلیل متون برای یافتن دیدگاهی که موجب یک تغییر مثبت در فرایند کار شود. به طور مثال اعداد می‌توانند به ما نشان دهند که چه تعدادی از اعضای جامعه ما در یک مشوق خاص برای یک سرویس عمومی درگیر هستند اما اعداد به خودی خود به ما نمی‌گویند چرا برخی در این فرایندها مشارکت نمی‌کنند، یا به طور مثال احساس عمومی در مورد یک مشوق خاص چگونه است – در این موارد مصاحبه ها، نظرسنجی ها و یا فرم‌ها به ما کمک می‌کند تا داده‌هایی را جمع آوری کنیم که لزوماً ما را ناچار به تحلیل متن می کند.

بی‌شک بسیاری دست کم یک بار به تحلیل مشارکت در شبکه‌های اجتماعی در سطحی فراتر از تعداد دنبال کنندگان یک هشتگ خاص پرداخته اند. شمارش داده‌هایی مانند تعداد لایک ها، توییت ها و کلیک ها نسبتاً امری بدیهی به شمار می‌رود اما بررسی کامل یک متن که افراد در شبکه‌های اجتماعی منتشر می‌کنند، و ایجاد یک تصویر معنادار از مفاهیم برآمده از آن کاری به مراتب دشوار تر است. تحلیل و آنالیز احساسات بی‌شک یک رویکرد است اما در نهایت این تحلیل – به صورت یک خلاصه عددی از یک فعالیت الگوریتمی برای دسته بندی متن – در نهایت و در بهترین حالت ممکن یک دید تک بعدی از یک مجموعه اطلاعات غنی به ما می دهد.

در ادامه به برخی سؤالات مهم در خصوص داده های کیفی می‌پردازیم.

توضیح داده های کیفی

چطور می‌توان کاری کرد که دیگران به اندازه داده‌های کمی به داده‌های کیفی نیز اهمیت بدهند؟

اعداد کیفیت جالبی در ذهن انسان‌ها دارند. مثلاً اختصاص یک مقدار عددی به هر چیز – مثلاً کیفیت یک فیلم سینمایی یا کیفیت بازی یک بازیکن بیسبال یا اینکه چقدر برای امتحانات دانشگاه آماده هستید – باعث می‌شود تا ارزیابی شما به ظاهر شکلی عینی، رسمی و بدون خطا به خود بگیرد. در عین حال هر گونه توصیف متنی و کلامی از آن چیز باعث می‌شود تا داده‌ها تنها به شکل نظر شخصی وانمود شوند.

اگر بگویم «با جمعی از افراد در مورد یک رستوران صحبت کردیم و بیشتر آن‌ها نظر مثبتی درباره آن داشتند» خواهید گفت: بسیار خوب اما این فقط نظر شخصی آن‌ها است. اما اگر بگوییم «نمره این رستوران ۴.۳ از ۵ است» ناگهان این واقعیت که رتبه و نمره این رستوران یک مقدار کمی است باعث می‌شود تا اطلاعات ما در مورد کیفیت آن شکلی رسمی به خود بگیرد – حتی با اینکه می‌دانیم این رتبه بندی ها و نمره‌ها بیشتر بر اساس ترجمان ذهنی افراد از نظرات خود در قالب یک مقیاس عددی قراردادی بیان شده‌اند که متفاوت از ذهن افراد شرکت کننده در این سیستم نمره دهی است.

داده، داده است. نمی‌توان گفت که اعداد ذاتاً داده‌هایی درست تر یا رسمی تر از داده های کیفی هستند. این ایده که هر چیزی به عنوان داده‌های صرفاً عینی وجود دارد خود یک مغلطه به شمار می‌رود چه رسد به اینکه باور داشته باشیم که تنها داده‌های کمی می‌توانند اطلاعات عینی در اختیار ما قرار دهند.

داده‌ها به صورت خود انگیخته به وجود نمی آیند. باید داده‌ها را سنجش و جمع‌آوری کرد و این مراحل توسط افراد یا ماشین‌هایی که به طور خودکار برنامه‌های ایجاد شده توسط انسان‌ها را انجام می‌دهند به مرحله اجرا می رسد. در تمامی این زنجیره گردآوری داده‌ها، انسان‌ها برای اینکه چه داده‌هایی را ثبت کنند، هر چند وقت یکبار اقدام به ثبت داده‌ها کنند، چه چیزهایی را مستثنی کنند، چطور داده‌ها را با هم تجمیع کنند، چطور داده‌ها را نرمالیزه کنند، چه میزان از آن را به اشتراک بگذارند و امثال این مباحث، تصمیم گیری می کنند.

تمام این مسائل خواه داده‌های مورد بحث کمی باشند یا کیفی، در خصوص داده‌ها صدق می کند. در‌واقع می‌توان گفت که کار روی داده های کیفی به مراتب سخت تر از داده‌های کمی است چرا که تجمیع یا فیلتر آن دشوار تر است. در نهایت این ایده که اعداد، داده‌های قابل باور هستند اما کلمات این‌گونه نیستند، یک سوتفاهم است.

 

آیا می‌توان از ابر کلمات برای نشان دادن داده های کیفی استفاده کرد؟

به طور کلی نمی‌شود گفت که این کار امکان‌پذیر نیست (به استثنای برخی موارد خاص). ابر کلمات به طور کلی به عنوان یک ابزار قوی برای تحلیل بصری شناخته نمی شود. الگوریتم هایی که ابر کلمات را می‌سازند تا حدودی مبهم هستند چرا که نمی‌توان اطمینان داشت که دقیقاً چرا این کلمات با این ابعاد در کلیت تصویر قرار گرفته اند.

فرض کنیم شما از ابر کلمات برای پاسخ به این سؤال استفاده کنید که «چه کلماتی بیشتر در یک مجموعه شامل ۱۰۰۰ سند به کار رفته است». فرض کنیم دو کلمه‌ای که بیش از بقیه و با اختلاف زیاد در این اسناد تکرار شده‌اند کلمات cat و supercalifragilisticexpialidocious باشن.

ابر کلمات شما به چه شکلی در خواهد آمد؟ آیا این دو کلمه اندازه فونت یکسان دارند؟ اگر این‌طور باشد، در‌واقع ابر کلمات شما را گمراه می‌کند چرا که cat به نسبت ابعاد، بسیار کوچک‌تر ازکلمه دیگر پر تکرار در این جا، یعنی supercalifragilisticexpialidocious است. بنابراین cat باید با سایز فونت بسیار بزرگ‌تری نمایش داده شود تا اندازه دو کلمه تقریباً برابر باشد اما آیا این باعث نمی‌شود که این‌طور به نظر برسد که cat کلمه متداول تری در این ابر کلمات بوده است؟

ابر کلمات داده های کیفی

در اینجا ما دچار یک دوگانگی هستیم. در‌واقع یا باید از افراد بخواهیم که مقایسه میان دو کلمه را بر اساس مساحت هر واژه انجام دهند و یا اینکه داده‌ها را به صورتی نمایش دهیم که کاملاً موجب گمراهی می شود. هم چنین در نظر داشته باشید که این ساده‌ترین حالت ممکن برای تحلیل ابر کلمات است که در این مثال در نظر گرفته ایم.

در‌واقع ابر کلمات را می‌توان به عنوان یک عنصر تصویری سرگرمی به کار برد (مثلاً به عنوان پس زمینه یک گزارش یا چیزی شبیه به آن) و یا از آن به عنوان یک نقطه آغاز کلی برای تحلیل اکتشافی استفاده کرد.ما ابر کلمات بهترین راه برای ارائه دیدگاه ما نیستند. ابر کلماتی که در بالای این مقاله مشاهده می‌کنید در‌واقع ابر کلمات همین مقاله است. اما آیا این ابر کلمات می‌تواند به خوبی نکات اصلی این پست را نشان دهد؟ آیا اطلاعات کافی به ما می دهد؟ احتمالاً خیر. اما هدف من از قرار دادن این ابر کلمات بیشتر نوعی تزئین چشمگیر صفحه است.

در عین حال بیایید به موضوع اصلی برگردیم: کاربرد واقعی ابر کلمات چیست؟ در‌واقع اعمال تحلیل کمی برای داده‌ های کیفی. ابر کلمات صرفاً شمارنده میزان تعداد دفعاتی است که هر کلمه در متن ظاهر می‌شود و خود کلمات را به صورت چکیده ای از داده‌ها نمایش می دهد. این فرایند را نمی‌توان تحلیل کیفی داده‌ های کیفی دانست بلکه تلاشی است برای استفاده از ابزارهای کمی برای تصویر سازی داده‌ها و اینکه داده‌ها قرار نیست به این ترتیب نمایش داده شوند.

راه مناسب برای استفاده از داده های کیفی برای ارتباط تصویری با مخاطب چیست؟

وقتی زمان بیان دیدگاه به صورت روشن و سریع از دل مجموعه داده های کیفی به مخاطب فرا می‌رسد، ممکن است اصلاً از چارت‌ها و گراف ها استفاده نکنید. توصیه ما این است که اگر استفاده از متن ساده یا اعداد به صورت مجزا بهترین راه انتقال پیام به مخاطب است، حتماً از همین راه استفاده کنید.

با این حال در بیشتر موارد ناگزیر برخی داده های کیفی نیاز به تجمیع دارند. ممکن است ما نیازمند تحلیل احساسات، مدل سازی از موضوعات یا تکنیک های مختلفی باشیم که خارج از حوصله ای مقاله است. حاصل این فرایندهای تجمیعی هر چه که باشد و هر نوع نمایش بصری که برای این کار انتخاب کنید، همیشه فرصت این وجود دارد که گراف یا چارتی را با بخشی از اطلاعات کیفی مرتبط همراه نموده و نمایش دهید.

نمونه گراف داده های کیفی

با اضافه کردن این متن ها به نمودار، به آن ارزشی می افزایید و حس و حال انسانی تری به نمودارها می دهید. اغلب هم چنان که به جداول و چارت‌ها نگاه می‌کنیم، تا حدودی از واقعیت موجود در زیر این تصاویر غافل می شویم، و یادمان می‌رود که اعداد در‌واقع رویه ای از زندگی واقعی انسان‌ها را نمایش می دهند.با وارد کردن یادداشت‌ها در کنار نمودار به صورت مستقیم و برآمده از منبع داده‌ها می‌شود این ایده را تقویت کرد و پیام نهایی را شفاف‌تر و قدرتمند تر بیان نمود.

منبع:

https://www.storytellingwithdata.com/blog/2020/11/8/words-are-data-too

مطالب پیشنهادی


ارسال نظر

نام
نام خود را وارد کنید
ایمیل
ایمیل خود را وارد کنید