Выборы и статистика

[Несколько слов о том, как это было написано. Я нашел интересные картинки в ЖЖ, и выложил сюда их короткое описание. По условиям моей работы в "Компьютерре", тематика колонок не должна относится к политике. Тем не менее, я попросил разрешения у главного редактора КТ, Кирилла Тихонова, написать колонку по анализу этих графиков. Он нашел выход из противоречия между правилами игры и моим желанием и предложил мне выложить этот текст на сайт КТ в разделе "Блоги": https://blogs.computerra.ru/20964. Так что я теперь заменяю на этой странице тот текст, который был выложен сначала, новым, более подробным.

Я благодарен за ссылки на иные страницы, где обсуждаются подобные графики. Например, похожие графики выложены здесь: https://hist-kai.livejournal.com/243639.html, но при их обсуждении автор приходит к выводу, с которым я не согласен. Фальсификаци в 5-7% стоят за маленькими пиками возле "круглых" цифр, а сам вытянутый вправо "хвост" дает более серьезное искажение. Как это соотносится с результатами экзитполлов, не знаю. Больше верю этим, статистически понятным результатам, которые основываются на официальных бюллетенях.

После критики и вопросов читателей написал продолжение. Оно здесь]

 

Психика разных людей по-разному обрабатывает входящую информацию. Одни стараются верить только тому, что видят их собственные глаза. Другие приходят к пониманию того, что органы чувств их часто обманывают и начинают искать точку опоры, которой можно доверять. Но что может помочь в таком поиске, ведь все, что мы получаем, мы получаем через наши несовершенные чувства? Можно ли найти какую-то надежную опору, например, в политике?

Знаете, какой возраст имеет расхожая шутка о трех качествах человека, которые встречаются в любых сочетаниях попарно, но никогда не сходятся в одной персоне все три вместе: уме, честности и партийности? Нет-нет, она родилась не в застойные времена. Ее знали уже в Афинах во времена Перикла.

Я «вляпался» в острое переживание политической жизни семь лет назад. В Украине были скандальные выборы. Партия власти (при поддержке российских политтехнологов) грубо продавливала своего кандидата. Если бы чугунные лбы усердствовали не столь чрезмерно, у них бы все получилось. Как ни странно, оказавшись на заоблачных высотах наша «элита» теряет связь с действительностью и забывает, что излишнее действие порождает чрезмерное противодействие. Я в то время даже съездил наблюдателем на последний тур выборов. Видел фальсификации, часть – пресек. По крайней мере в том городишке, где я наблюдательствовал, по большинству участков победил кандидат, в чью пользу мухлевали, а на «моем» – другой, ущемляемый. Победа? Наверное. Увы, к улучшению качества жизни она не привела. Может, чуть выросло ощущение собственного достоинства.

Прошло время. Сейчас, когда вспоминают те выборы, часто говорят, что в одной половине страны фальсифицировали результат в пользу одного человека, в другой – в пользу иного. Наверное, это правда. Как соотносился мой опыт с действительной картиной? Сегодня это сложно сказать, и я даже засомневался в адекватности собственных воспоминаний.

Теперь лихорадит Россию. Я – регулярный читатель «Ежедневного журнала», «Новой газеты», «Эха Москвы». Я читаю описания нарушений на выборах, официально описанные наблюдателями. Но ведь то, о чем пишут эти сайты – лишь небольшая и неслучайная выборка! Может, эти наблюдатели неправильные, и где-то в другом месте лежат другие заявления, описывающие противоположные нарушения? Можно ли быть уверенным, что соратники г-на Жириновского или г-на Зюганова лучше соратников лидеров партии власти? Как увидеть картину в целом, не становясь на партийную позицию (чтоб не терять ни ум, ни порядочность)?

И вдруг, гуляя по сети, я нашел то, что сделало для меня картину вполне ясной. Спасибо статистике! Теперь я знаю, на что можно опереться даже в политике: на закономерности, вырастающие из естественных и точных наук.

Это распределения голосов, отданных за разные партии на разных избирательных участках. Всего лишь распределения, ничего больше.

 
 
Распределение участков (по всей России) по числу голосов, отданных за наиболее успешные партии (взято c oude-rus.livejournal.com/542295.html). Каждая точка на кривой - число участков, на которых данная партия получила определенный процент голосов
 
Начну издалека. Изменчивая величина, на которую влияет множество независимых факторов, приобретает вполне определенное распределение. Один из простых способов его демонстрации был придуман Френсисом Гальтоном (двоюродным братом Чарльза Дарвина, между прочим). Вот наклонная доска. Сверху по ней скатывается дробь. Дробинки сталкиваются друг с другом, с торчащими из доски штырьками и скапливаются внизу.
 
Аппарат Гальтона. Скатившаяся вниз дробь сформировала характерное колоколообразное распределение
 

Увеличивая количество независимых факторов мы перейдем к распределению, которое описывается гауссианой (функцией, которую описал Карл Фридрих Гаусс). Иначе такое распределение называется нормальным.

Распределение участков по количеству голосов, отданных за достаточно популярную партию – величина, распределение которой должно быть близким к нормальному. Оговорюсь, что если вероятность получения какой-то партией на целом участке хотя бы одного голоса – редкое событие, распределение становится пуассоновым. Может быть, это случилось с «зеленой» партией, показанной на графике. Но если за партии голосуют достаточно часто (а остальные показанные на рисунке партии соответствуют этому условию), распределение стремится к нормальному.

Удивительное дело! Распределения трех партий более-менее колоколообразны, а четвертой (а вы смогли бы без графика догадаться, какой именно?) – нет!

Итак, на результаты одной партии действовали не многие случайные факторы (индивидуальные предпочтения избирателей и многие иные случайные события), а один. Фальсификации. У «коричневой» партии виден длинный «хвост», вытянутый вправо, в область невероятно высоких значений. На этом «хвосте» заметны всплески, соответствующие круглым цифрам. Не могу найти им иного объяснения, кроме того, что это – следствие выполнения команд наподобие: «…и если будет меньше 60% – ответите головами!». Такие же всплески видны на вершине распределения у «красной» партии – у них откусывали до круглых цифр, если те слишком много набирали.

А вот более однородная выборка, московская. Колокола стали более стройными и аккуратными (исчезли различия между регионами страны, выбивавшиеся из числа многих случайных факторов). Нарушения видны для двух партий. Что-то подхимичили с «зеленой», а результат «голубой» – завышали, причем грандиозно.

 
 
Распределение участков по числу голосов, отданных за наиболее успешные партии, по Москве (этот и следующий графики взяты с onsb.org/elections-moscow-2011-12-07.html). Обратите внимание: цветовые обозначения партий иные, чем на предыдущем рисунке!
 
Как это делали? И на это есть ответ. Вот еще одна московская картинка. Смотрите: на участках, где явка (по протоколам), была 50% или 80%, результаты большинства партий оставались примерно одинаковыми. А у «голубых» точки образуют две облачка: горизонтальное и наклонное. Там, где считали честно, уровень голосов за эту партию оставался относительно постоянным; эти точки формируют горизонтальное облачко. Там, где явку (на бумаге) повышали благодаря вбросам, количество голосов за эту партию неуклонно росло, формируя наклонное облачко.
 
Зависимость числа голосов, поданных на участках в Москве за каждую партию, от явки на каждом участке
 

Можно ли объяснить эти графики как-то иначе? Теоретически, да. Их строил не я, они скачаны по указанным мной адресам. Авторы этих графиков утверждают, что строили их по результатам Центризбиркома. Вы предполагаете, что на сайте Центризбиркома лежат иные данные? Проверьте! А я этим графикам поверил.

За каждой точкой, выбивающейся из статистически закономерной картины, стоит серьезное преступление, совершенное группой лиц по предварительному сговору. Заказчики – политики и администрация разных уровней; исполнители, чаще всего, – школьные учителя да жэковские работники. Представьте: если посадить всех фальсификаторов, как того требует закон, образование обезлюдеет! А вы можете представить себе человека, который пишет официальное заявление о переводе сына или дочери из одной школы в другую, мотивируя это тем, что он не хочет, чтобы его ребенок учился в школе, где учителя – фальсификаторы и преступники?

Из сказанного есть несколько следствий.

Глобальные. Скорее всего, результат выборов фальсифицирован массово и до такой степени, что его можно лишь отменить. Можно, конечно, прикинуть, сколько набрала какая партия в действительности. Но те, кто планировали и выполняли обман (а это они управляли и, вероятно, будут управлять судьбой России), никогда не признают такой результат.

Локальные. Где на приведенных графиках лежит результат, показанный на вашем участке, в школе, где учатся ваши дети или работают ваши знакомые? Может, надо поинтересоваться, как чувствуют себя люди, участвовавшие в преступлении? Каждая синяя точка в наклонном облачке на последнем графике – это результат преступных действий целой группы москвичей, по большей части – образованных и социально активных. У них есть семьи, друзья, коллеги, круг людей, кого уважают они и кто уважает их… И это только в Москве.

Что делать? С моей точки зрения (точки зрения постороннего) – предупредить рядовых фальсификаторов, простить раскаявшихся и провести новые выборы. И не забыть построить по новым результатам статистические распределения, а затем вдумчиво проанализировать их особенности!

 

Коментарі

Картинка користувача Helga.

Действительно, так явно! А может ли такой анализ графиков быть официальным аргументом для обвинения в фальсификации?

Представь себе: показывают председателю комиссии, что его протокол соответствует точке, находящейся на графике совсем не там. Совершенно ясно, что он преступник. А на суде он скажет: "а вот могло же быть такое совпадение, вот есть же, хоть и маловероятный, но соответствующий такому результату край распределения". И действительно, есть. В каждом конкретном случае низкая, но хоть как-то регистрируемая вероятность случайно высокого результата ПЖиВ есть. В целом для распределения - его образование без фальсификаций астрономически низка. Значит, по справедливости результаты выборов следует отменять.
А в целом, для доказательства того, что выборы были искажены массовыми фальсификациями, меня этот аргумент очень убеждает. Но примут ли его судьи соответствующего суда - бог весть.

Картинка користувача Walterinnesia.

Если учесть что соответствующий суд уже сам по себе обычно принадлежит лицам заинтересованным в фальсификации, то вряд ли даже столь подробный и обоснованный анализ с вопиюще очевидными нарушениями на выборах даст плодотворный результат.
Как показывает практика и в нашей стране, и у наших глубокоуважаемых соседей, народ в подобных ситуациях ничего практически не решает.

Картинка користувача Crower.

Дмитрий, на сколько я понял отсюда, в данные, на основе которых составлены первоначальные графики, закралась некоторая погрешность.
Кстати, из интереса пробовал поанализировать отдельно информацию по своей области. Получил разброс по участкам достаточно большой, но таких красивых картинок не получил. А на графике с зубцами получил зубцы практически по всем партиями. Меня это, конечно, озадачило. Планирую ещё помедитировать над данными. :)

Но с анализом, проведенным по указанному Вами адресу, я не вполне согласен.

Картинка користувача Crower.

Вырезая пики на круглых цифрах автор создавал видимость значительного уменьшения количества фальсифицированных голосов. Но нигде не доказал, что такие фальсификации являются преобладающими. Т.е. начиная с третьего графика - видимость оценки.

Но он поднят важный вопрос: предложил считать надо не количество УИК-ов, а количество голосов. К сожалению, не раскрыв свои соображения. Когда я попытался сравнить результаты этих двух подходов при меньшем наборе данных - по своей области, то обнаружил существенное различие в графиках. Не знаю это ли автор имел ввиду, но подсчёт по количеству УИКов существенно искажает картину, и, в том числе, создаёт иллюзию того, что на основании такого анализа легко выявить фальсификации. К сожалению, по интернету уже пошли гулять кучи графиков, в которых акцент даётся на количество УИКов. И даже в следующей Вашей статье у молодого человека на плакате по оси ординат - количество УИК.

Картинка користувача Гексли.

но опубликованная перед обсуждаемыми выборами статья в Esquire - более запутанная и сложная для понимания, зато с зарубежными данными и данными по РФ предыдущих годов.

Некоторые из них неожиданно демонстрируют, что ЕР пользуется похожей схемой уже не впервые.

Да, прикол старый. Но когда на него натыкаешься, чувствуешь, что сделал некоторое открытие (хотя бы для себя).

Пожалуйста, прокомментируйте, как по вашему мнению соотносятся приведенные вами графики с графиками, полученными для идеального распределения голосов :http://letopis.kulichki.net/2011/10-2011/nom2042.htm
http://letopis.kulichki.net/2009/11-2009/nom1815.htm
Если конечно верить,что данные моделирования соответсвуют действительности)
Каюсь, что сам не возьмусь проверять,так ли это - боюсь цифирей,верю картинкам.

Простите, что отвечал долго. Подробный ответ здесь: http://batrachos.com/node/500

Так достаточно наглядно, я убедился.