سه‌شنبه، خرداد ۲۵، ۱۳۸۹

در رد یا تایید تقلب

تو این چند روز یک فایلی دیدم برای پاسخ به تقلب در انتخابات پارسال در ایران که یکی از بچه های دکتری ریاضی "آقای امید نقشینه" گردآوری کرده اند. به نفسه برخورد منطقی اینچنینی که بعد از یک سال دریافته شده که بهتر است در اوقات فراغت دفن کردن هفتگی جنازه سبز ادعایی اندکی نیز به پاسخ دادن فکر کنیم، قابل تقدیر است و به قول فردوسی پور لااقل به عنوان یه همدانشگاهی از ایشون کمال تشکر رو دارم. 
اما واقعا بهتر نیست اگر متنی قرار است به عنوان مقاله ای علمی پاسخ به سوالات مطرح شده باشد، دیگر بهتر است خالی از بیانیه های سیاسی باشد. اما بعد، فقط در مورد بحث های علمی که در آن مطرح کرده اید صحبت میکنیم، در مورد تست بنفورد، چون به همان نتایج قبلی استناد کرده بودید و کاری جدیدی نبود، بحثی لازم نیست، درست است که این تست تنها احتمال وجود تقلب را بیان میکند و کسی شکی در آن ندارد، اما بهتر است بیان شود که این تست در مورد انتخابات پارسال احتمال عددسازی برابر 99 درصد، کاملا شک برانگیز است، در حالی که همین تست در مورد انتخابات ریاست جمهوری قبلی نیز در همان مرجع انجام شده و همچنین آرای ایالت فلوریدا (همان مرجع)، میتوانید مقایسه کنید.
اما در مورد خطی بودن آمار که هنوز هم به نظرم یکی از مشکوک ترین اشتباهاتی است که پارسال صورت گرفت، (با احتساب اختلافات فراوان در گزارش های ارایه شده که اگر خاطرتان باشد در گزارش آمار تفکیکی بارها آمار از روی سایت وزارت کشور برداشته شد تا اصلاح شود به طوری که مثلا در مرحله اول یادم هست که مجموع آرا نیز حتی حدود 80 هزار رای تفاوت داشت).
یکی از منابع رفرنس داده شده در رد احتمال وجود تقلب برای نتایج خطی مطلب نت سیلور است، همان مطلبی که در همان زمان در سایت الف نیز منتشر شد.
در همان زمان نیز من در مطلبی پاسخ برای همان ادعا را نوشتم:

این روند خیالی که اگر به اینصورت آرا آمریکا اعلام میشد، یک بازی با اعداد خنده دار است. آمریکا 50 ایالت دارد، برای همین برای اینکه این ترتیب5 تایی اعلام شود (بر اساس الفبا ایالات در نظر گرفته اند) تا بتواند خطی باشد کاملا خنده دار است. برای اینکه خیلی ساده احتمال اعلام در 5 بازه برابر ترکیب 49 و 4 میشود یعنی به عبارتی 211876 حالت مختلف. خوب بدیهی است که در یکی از این حالت ها ممکن است رگرسیون خط نزدیک به یک باشد. (اما بایستی در نظر داشت که در آمریکا این حالت رخ نداده!!) خیلی هم نا معقول هم هست که عدل همین اتفاق بیافتد. تازه نکته جالب دیگه این هست که در ایران نمودار در 6 مرحله به اینصورت در آمده. اما این محقق  آمار برای این در 5 مرحله این کار را کرده چون آسانتر بوده، برای 6 مرحله وضعیت اسفبارتر هم هست، در آنصورت تعداد حالات برابر 1906884 است یا چیزی حدود 2 میلیون حالت.

این احتمال نیز خودتان بهتر در جریان هستید. اما در مورد شبیه سازی که برای اعلام نتایج انجام داده بودید، احساس نکردم جدی گفته باشید، اما انصاف داشته باشید، مرتب کردن صندوق ها و تعیین نقاط اعلام رای نزدیک آمار اعلام شده ( در صورتی که حداکثر رای هر صندوق در حدود چند هزار در برابر گام چند میلیون آمار اعلامی) خوب باید نیز بسیار شبیه هم باشند، مگر واقعا قبل از شبیه سازی انتظار دیگری داشتید؟ این کجایش شبیه سازی اعلام نتایج است؟ این دقیقا معادل همین مطلبی است که تعداد اعداد بسیار زیادی را از اول در چند استپ چنان مرتب کنیم که حتما شیب حفظ شود. که در بالا توضیح داده شده است.

البته بحث در مورد انتخابات پارسال بسیار است، اما بهتر میدانید که پاسخ را چطوری میدهند.
پ.ن : در ضمن من عادت ندارم ولی انگار کلا بعضی ها علاقه زیادی به استفاده از علامت تعجب دارند، برای اینکه حتما القا کنند که مطلب بسیار غیر واقعی، یاد خبرهای بولتن دانشگاه افتادم و البته ایضا فارس. اگر شما نیز عادت داشتید خودتان به جای همه نقطه ها علامت تعجب بگذارید.

۲ نظر:

  1. اگر دو فرآیند تصادفی در طول زمان روند صعودی داشته باشند (میانگین هر متغیر با زمان صعود کند)٬ منحنی آن‌ها بر حسب هم بسیار به خط نزدیک خواهد بود. بنابراین روند خطی آرای اعلام شده لزومآ به معنای تقلب نیست. تاکید می‌کنم که منظورم این نیست که تقلب نشده یا این که تقلب شده. منظورم این است که با این استدلال اشتباه است.

    پاسخحذف
  2. سلام

    من اصلا با این قضیه کاری ندارم، صحیت ام با روش مطرح شده در این متن بود و استفاده از واژه "شبیه سازی" که مثلا نشان از کار علمی عظیمی میدهد.
    در ضمن خودتان هم حتما قبول دارید که اینجا دو رندوم وریبل نداریم بلکه مجموعی از متغیرها با توزیع های مختلف. و اینکه واقعا تا چه حد احتمال چنین پدیده ای بدون دستکاری در آرا امکان پذیر است.
    در ضمن همانطور هم که میدونید، الان همه خبرگزاریها این متن شما رو به عنوان یه اثبات علمی و با تاکید قاطع بر رزومه تان چاپ کرده اند. خواستم فقط از خودتون بخوام یه خورده با انصاف تر روش خودتونو بخونید و قضاوت کنید. بالاخره به روزی همه باید به داوری بریم.  

    پاسخحذف

برای اینکه اولین کسی باشم که دارم کامنتهامو میخونم، بعد از خوندن منتشر میشوند. ممنون از نظرتان