اهمیت آماری: تعریف، مفهوم، معناداری، معادلات رگرسیون و آزمون فرضیه

فهرست مطالب:

اهمیت آماری: تعریف، مفهوم، معناداری، معادلات رگرسیون و آزمون فرضیه
اهمیت آماری: تعریف، مفهوم، معناداری، معادلات رگرسیون و آزمون فرضیه

تصویری: اهمیت آماری: تعریف، مفهوم، معناداری، معادلات رگرسیون و آزمون فرضیه

تصویری: اهمیت آماری: تعریف، مفهوم، معناداری، معادلات رگرسیون و آزمون فرضیه
تصویری: آموزش رگرسیون خطی به زبان ساده 2024, ممکن است
Anonim

آمار از دیرباز بخشی جدایی ناپذیر از زندگی بوده است. مردم همه جا با آن روبرو می شوند. بر اساس آمار، نتیجه‌گیری در مورد اینکه کجا و چه بیماری‌هایی شایع است، چه چیزی در یک منطقه خاص یا در میان بخش خاصی از جمعیت بیشتر مورد تقاضا است، به دست می‌آید. حتی ساخت برنامه های سیاسی نامزدهای نهادهای دولتی بر اساس داده های آماری است. آنها همچنین توسط زنجیره‌های خرده‌فروشی هنگام خرید کالا استفاده می‌شوند و تولیدکنندگان در پیشنهادات خود با این داده‌ها هدایت می‌شوند.

آمار نقش مهمی در زندگی جامعه دارد و تک تک اعضای آن را حتی در موارد کوچک تحت تاثیر قرار می دهد. به عنوان مثال، اگر طبق آمار، اکثر مردم رنگ های تیره را در لباس های یک شهر یا منطقه خاص ترجیح می دهند، پیدا کردن یک بارانی زرد روشن با چاپ گل در فروشگاه های محلی بسیار دشوار خواهد بود. اما چه مقادیریآیا این داده ها با هم جمع می شوند تا چنین تأثیری داشته باشند؟ به عنوان مثال، "از نظر آماری معنی دار" چیست؟ دقیقاً منظور از این تعریف چیست؟

این چیست؟

آمار به عنوان یک علم از ترکیبی از مقادیر و مفاهیم مختلف تشکیل شده است. یکی از آنها مفهوم «اهمیت آماری» است. این نام مقدار متغیرها است که احتمال ظهور سایر شاخص ها در آنها ناچیز است.

محاسبه شاخص های آماری
محاسبه شاخص های آماری

برای مثال، ۹ نفر از هر ۱۰ نفر در هنگام پیاده روی صبحگاهی برای قارچ در جنگل پاییزی پس از یک شب بارانی، کفش های لاستیکی روی پاهای خود می پوشند. احتمال اینکه در نقطه ای 8 نفر از آنها بر روی بوم مقرنس بگذارند ناچیز است. بنابراین، در این مثال خاص، عدد 9 چیزی است که به آن «اهمیت آماری» می‌گویند.

بر این اساس، اگر مثال عملی ارائه شده را بیشتر توسعه دهیم، فروشگاه های کفش تا پایان فصل تابستان چکمه های لاستیکی را به مقدار بیشتری نسبت به سایر زمان های سال خریداری می کنند. بنابراین، بزرگی مقدار آماری بر زندگی عادی تأثیر دارد.

البته در محاسبات پیچیده مثلاً هنگام پیش بینی شیوع ویروس ها تعداد زیادی متغیر در نظر گرفته می شود. اما ماهیت تعیین یک شاخص قابل توجه از داده های آماری، صرف نظر از پیچیدگی محاسبات و تعداد مقادیر متغیر، مشابه است.

چگونه محاسبه می شود؟

هنگام محاسبه مقدار شاخص "اهمیت آماری" معادله استفاده می شود. یعنی می توان استدلال کرد که در این مورد همه چیز توسط ریاضیات تعیین می شود.ساده ترین گزینه محاسبه زنجیره ای از عملیات ریاضی است که در آن پارامترهای زیر دخیل هستند:

  • دو نوع نتیجه به‌دست‌آمده از نظرسنجی‌ها یا مطالعه داده‌های عینی، مانند مقدار خرید، که با a و b نشان داده شده است؛
  • نشانگر اندازه نمونه برای هر دو گروه – n;
  • ارزش سهم نمونه ترکیبی - p;
  • خطای استاندارد - SE.

مرحله بعدی تعیین نمره کلی آزمون است - t، مقدار آن با عدد 1.96 مقایسه می شود. 1.96 مقدار متوسط است که محدوده 95٪ را بر اساس تابع توزیع t دانش آموز منتقل می کند.

فرمول برای محاسبه ساده
فرمول برای محاسبه ساده

اغلب این سوال مطرح می شود که تفاوت بین مقادیر n و p چیست. این تفاوت ظریف با یک مثال آسان است. فرض کنید که اهمیت آماری وفاداری به هر محصول یا برندی از مردان و زنان محاسبه شده است.

در این مورد، حروف زیر به دنبال آن خواهند بود:

  • n - تعداد پاسخ دهندگان؛
  • p - تعداد رضایت از محصول.

تعداد زنان مصاحبه شونده در این مورد n1 تعیین می شود. بر این اساس، مردان - n2. همان مقدار دارای اعداد "1" و "2" از نماد p است.

مقایسه نمره آزمون با میانگین صفحات گسترده دانش آموز به چیزی تبدیل می شود که به آن "معناداری آماری" می گویند.

منظور از تأیید چیست؟

نتایج هر محاسبه ریاضی همیشه قابل بررسی است، این در مدرسه ابتدایی به کودکان آموزش داده می شود. منطقی است که فرض کنیمکه از آنجایی که آمارها با استفاده از زنجیره محاسبات تعیین می شوند، پس بررسی می شوند.

با این حال، آزمایش اهمیت آماری فقط ریاضی نیست. آمار با تعداد زیادی متغیر و احتمالات مختلف سر و کار دارد که همیشه قابل محاسبه نیستند. یعنی اگر به مثال کفش‌های لاستیکی در ابتدای مقاله برگردیم، ساختار منطقی داده‌های آماری که خریداران کالا برای فروشگاه‌ها به آن‌ها تکیه می‌کنند می‌تواند در اثر هوای خشک و گرم که برای پاییز معمولی نیست مختل شود.. در نتیجه این پدیده، تعداد افرادی که چکمه های لاستیکی خریداری می کنند کاهش می یابد و مراکز فروش متحمل ضرر می شوند. البته یک فرمول ریاضی قادر به پیش بینی ناهنجاری آب و هوا نیست. این لحظه "اشتباه" نامیده می شود.

ابزارهایی برای تجسم داده های آماری
ابزارهایی برای تجسم داده های آماری

این فقط احتمال چنین خطاهایی است و بررسی سطح اهمیت محاسبه شده را در نظر می گیرد. هم شاخص‌های محاسبه‌شده و هم سطوح معنی‌دار پذیرفته‌شده، و هم مقادیری را که معمولاً فرضیه نامیده می‌شوند، در نظر می‌گیرد.

سطح اهمیت چیست؟

مفهوم "سطح" در معیارهای اصلی معناداری آماری گنجانده شده است. در آمار کاربردی و کاربردی استفاده می شود. این یک نوع مقدار است که احتمال انحرافات یا خطاهای احتمالی را در نظر می گیرد.

سطح بر اساس شناسایی تفاوت ها در نمونه های آماده است، به شما امکان می دهد اهمیت یا برعکس تصادفی بودن آنها را تعیین کنید. این مفهوم نه تنها دارای معانی دیجیتالی است، بلکه دارای تفاسیر عجیب و غریب آنها نیز می باشد. توضیح می دهندچگونه باید مقدار را درک کنید، و خود سطح با مقایسه نتیجه با شاخص میانگین تعیین می شود، این میزان قابلیت اطمینان تفاوت ها را نشان می دهد.

بحث آمار
بحث آمار

بنابراین، می توانیم مفهوم سطح را به سادگی تصور کنیم - این نشانگر خطا یا خطای قابل قبول، احتمالی در نتیجه گیری از داده های آماری به دست آمده است.

چه سطحی از اهمیت استفاده می شود؟

اهمیت آماری ضرایب احتمال خطا در عمل بر اساس سه سطح اساسی است.

اولین سطح آستانه ای است که در آن مقدار 5٪ است. یعنی احتمال خطا از سطح معنی داری 5 درصد فراتر نمی رود. این بدان معناست که اطمینان به بی عیب و نقص بودن و خطاناپذیری نتیجه گیری های انجام شده بر اساس داده های تحقیق آماری 95% است.

سطح دوم آستانه ۱٪ است. بر این اساس، این رقم به این معنی است که می توان با داده های به دست آمده در طی محاسبات آماری با اطمینان 99 درصد راهنمایی کرد.

سطح سوم - 0.1%. با این مقدار، احتمال خطا برابر با کسری از درصد است، یعنی خطاها عملاً حذف می شوند.

فرضیه در آمار چیست؟

خطاها به عنوان یک مفهوم به دو حوزه مربوط به پذیرش یا رد فرضیه صفر تقسیم می شوند. فرضیه مفهومی است که بر اساس تعریف، مجموعه‌ای از نتایج نظرسنجی، سایر داده‌ها یا گزاره‌ها در پس آن پنهان است. یعنی توصیفی از توزیع احتمال چیزی مرتبط با موضوع حسابداری آماری.

اهمیت آماری رگرسیون
اهمیت آماری رگرسیون

در محاسبات ساده دو فرضیه وجود دارد - صفر و جایگزین. تفاوت بین آنها در این است که فرضیه صفر بر این ایده استوار است که بین نمونه های دخیل در تعیین معنی داری آماری تفاوت اساسی وجود ندارد و فرضیه جایگزین کاملاً مخالف آن است. یعنی فرضیه جایگزین بر اساس وجود تفاوت معنی‌دار در این نمونه‌ها است.

اشتباهات چیست؟

اشتباهات به عنوان یک مفهوم در آمار با پذیرش این یا آن فرضیه به عنوان صحیح رابطه مستقیم دارد. آنها را می توان به دو جهت یا نوع تقسیم کرد:

  • نوع اول به دلیل پذیرش فرضیه صفر است که نادرست است؛
  • ثانیه - ناشی از پیروی از جایگزین.
مشاهده نمودارهای آماری
مشاهده نمودارهای آماری

خطای نوع اول "مثبت کاذب" نامیده می شود و در همه زمینه هایی که از آمار استفاده می شود بسیار رایج است. بر این اساس خطای نوع دوم را منفی کاذب می نامند.

چرا در آمار به رگرسیون نیاز داریم؟

اهمیت آماری رگرسیون این است که با کمک آن می توان تعیین کرد که مدل وابستگی های مختلف محاسبه شده بر اساس داده ها چقدر با واقعیت مطابقت دارد. به شما این امکان را می دهد که کافی بودن یا نبود عوامل را برای حسابداری و نتیجه گیری شناسایی کنید.

مقدار رگرسیون با مقایسه نتایج با داده های فهرست شده در جداول فیشر تعیین می شود. یا با استفاده از تحلیل واریانس. شاخص های رگرسیون زمانی مهم هستندمطالعات و محاسبات پیچیده آماری شامل تعداد زیادی متغیر، داده های تصادفی و تغییرات احتمالی است.

توصیه شده: