Чернобурка

Плющев про ДЭГ



- скорей всего эксперты Плющева про вброс не правы, они его недооценивают. Если могли переголосовывать за Рыжкова внутри воскресенья, то вероятно, можно вести речь что и в остальные дни внутри вброса были голоса не только за едро и административных кандидатов, но и голоса за оппозицию тоже, то есть явка реальная на онлайн голосование была сильно завышена. Что бы скрыть вброс его пытались сделать более интеллектуальным, и накидывать не только едру, но и всем остальным, только с другим процентом чем реальные избиратели. Это может объяснить дикую динамику за яблоко и лдпр, когда результат первых низкий в начале и очень высокий в конце голосования, а у лдпр с точностью до наоборот.
Чернобурка

ДЭГ наркоманские графики

Продолжаем строить наркоманские графики по дистанционному голосованию в Москве:
- процент проголосовавших за мелкие партии по часам от количества проголосовавших в этот час. Видна чётко ночная нестабильность, когда мало народа голосовало. Процент так же сильно проседает, если партия власти в это время много набрала.
- явка за мелкие партии от величины все минус едро, все выравнились более менее, кроме ночи. Пенсионеры в воскресенье вечером сильно проседают, ЗА (Зеленая альтернатива) их начинает перегонять.
- явка за мелкие партии в процентах от результата КПРФ.  Явка за Коммунистов России достаточно ровная, остальные карлики в первые два дня по их ходу скорее росли относительно КПРФ.
- явка за мелкие партии в процентах от результата Новых людей. У пенсионеров тренд скорее понижающийся всё голосование, у остальных ровно, но внутри дней у многих повышение.
- явка за мелкие партии в процентах от результата Яблока, так как процент за эту партию заметно рос по ходу голосования, то у всех карликов явный понижающийся тренд.
- явка мелких партий по часам, процент рассчитывается от результатов едра, графики колбасит жутко, кроме ГП (Гражданская платформа), искривить ноль невозможно.
- явка за мелкие партии от результата все минус кпрф, карликов колбасит. Выравнивания не происходит, когда внутри делителя есть явка за едро.

ЗЫ. все графики делались по публичной базе данных без дорасшифроки бюллетеней, которые почему-то не все в ней раскодированы.
Чернобурка

ДЭГ в Москве федеральный округ, динамика голосования

По идеи избиратели партий решают, когда им голосовать, независимо и им всё равно в пятницу прийти или в субботу. И коммунист, и единорос, и лдпровец по идеи должны приходить одинаково:
- нижняя шакала часы с начала голосования, вертикальная процент партии за час.
То есть графики голосования по времени, когда в каждый час отмечается сколько процентов кто набрал, должны быть примерно прямыми в районе средней поддержки партии. Но как видно на дэг это совсем не так, по ходу голосования результаты в час могут отличаться в разы, например яблоко в первый часы в районе 2.5 процентов, а в последние в районе 7.5 от проголосовавших за час.
Едро то улетает за пятьдесят в начале голосования, то проседает менее 30 в конце. Логически объяснить это сложно, особенно когда взлеты случаются в районе двух ночи, а падения поддержки в четыре вечера. Никакой стабильности рейтинга не видно.

Можно ли с этим как то поиграться? Можно попробовать:

 - можно вычесть из всей явки результат едра и сделать вид что явка была именно такая, тогда результаты всех партий становится более прямыми, как должны быть в реальности, а результат едра продолжает колбасит. На остальных графиках начинают быть видны ночные пики, когда явка маленькая и результат должен быть менее стабильным. Но тем не менее чётко видно что в начале голосования ЛДПР опережал яблоко, а дальше наоборот. При этом понижательный тренд у лдпр от начала голосования до самого конца, а у яблока наоборот, а новые люди стабильно выше обоих.

Можно пытаться строить графики по времени доли партии, то есть делать так что бы сумма по всем трём дням для каждой партии была сто процентов, а потом смотреть отличия между ними:


 - в целом графики достаточно похожи, новые люди и кпрф почти совпали, но нигде нет точного совсем уж совпадения - что для всех мало набравших партий скорее объяснимо малой явкой за них и потому малой стабильностью их результатов в час, но отличия кпрф и едра явно имеют какую-то другую природу, видно что народ за едро делал акцент на первые часы, а электорат коммунистов на последние.

ЗЫ. все графики делались по публичной базе данных без дорасшифроки бюллетеней, которые почему-то не все в ней раскодированы.
Чернобурка

ДЭГ 3 часа динамика

4.1 - это выдача бюллютней на федеральном, 4.2 - на одномандатном округе, 6.1 и 6.2 соотвественно принятие зашифрованных заполненных голосов.

Оказывается на федеральном округе некоторое количество времени 3600-4500 секунд с начала голосования тоже была ступенька, когда 1597 избирателей всего пришло за 15 минут, хотя 450000/180*15=37500 человек в среднем приходило в первые три часа за 15 минут, при этом количество проголосовавших таки не тормозило в этот момент и смогло превысить не надолго количество выданных бюллетеней, чего по хорошему быть в первые 3 часа не должно. То что по одномондатному округу трешь и зеленная кривая ниже темно красной очевидно.

Похоже динамика за первые три часа откровенно нарисованная.
Чернобурка

ДЭГ прийти через два дня

Оказывается после 17:00 воскресенье на голосование по федеральным округам пришло аж 15 человек, которые по одномандатным пришли и голосовать на 2 дня и почти восемь часов раньше:


SELECT date_trunc('hour',a.datetime),count(*),sum(b.datetime-a.datetime),min(b.datetime-a.datetime),max(b.datetime-a.datetime),avg(b.datetime-a.datetime) FROM transactions a join (SELECT * from dblink('dbname=testdb2','SELECT datetime,payload FROM transactions where method_id = 4 and status->>''type'' = ''success'' ') AS b(datetime timestamp with time zone, payload json)) b on a.method_id = 4 and a.status->>'type' = 'success' and b.datetime-a.datetime < - interval '2 day' and a.payload->>'voter_id'=b.payload->>'voter_id' group by date_trunc('hour',a.datetime);

date_trunc | count | sum | min | max | avg
------------------------+-------+------------------------+-----------------------+-----------------------+--------------------------
2021-09-19 17:00:00+03 | 15 | -30 days -96:32:39.601 | -2 days -07:45:26.645 | -2 days -03:18:54.096 | -2 days -06:26:10.640067


- что это? Люди проголосовали в пятницу по одному бюллетеню, а про другие выборы забыли, а потом одномоментно вспомнили? Забавно.
Чернобурка

ДЭГ первые 5 часов

Решил померить сколько уходило у людей времени на то, что бы перейти от бюллетеня на федеральном округе к бюллетеню на одномандатном, это можно сделать так как voter_id один на оба голосования. По горизонтале отмеряем отрезки в шесть секунд, их в часе 600 штук, по вертикале количество взявших два бюллетеня с таким лагом.

В первый час народ почему-то между этими голосованиями шёл в большинстве от 49 минут до часу, что можно столько делать времени загадка. Час думать над галочкой? Час понимать что голосования два?
При этом есть короткие пики в 6, 9 минут и маленькое плато 12-14.

Во второй час народ ускорился, и между голосованиями время занимало от 26 до 41 минуты, всё равно очень долго.
Появились люди которые шли в обратном направлении, но их очень мало и гафик в этой зоне трудно отличим от нуля.

В третий час данный путь у почти всех занимал от 8 до 26 минут, вне этого отрезка почти никого, больше 26 минут вообще никого нет.

В четвертый час динамика уже близка к той что есть в общем по всем трём дням, больше 8 минут никто от одного голосования до другого не шёл.

5 час, больше двух минут от одного биллютеня до другого ни у кого не проходило.

Обший график за все три дня, по вертикале очень сильно зарезан, там в нуле пик очень высокий. Рябь 8-26, 26-41, 48-60 минут вероятно на совести первых трёх часов, в остальные дни таких долгодумающих было не много.

Collapse )

Вывод

Динамика в первые три часа очень сильно отличается от динамики остальных трёх дней.

В дальнейшем надо понять распределение людей по дням и часам в зависимости от этой временной задержки. Пик в нуле более подробно посмотреть, уж больно высок.
Чернобурка

Попытлася собрать три предыдущих записи во что-то более вразумительное

Первый час дистанционного голосования в Москве по одномандатным округам выдался очень примечательным.

Речь о первых двух столбцах на этом графике. Что бы увидеть эту картину нужно сдвинуть ползунок на сайте до 17 сентября, которое по умолчанию не показывается. Первый столбец это число выданных бюллетней, а второй число принятых.

Так вот график говорит, что с 8 утра 17 числа до 9 утра были выданы всего 22219 бюллетеня, при этом приняли 103339 бюллетень, почти в пять раз больше. Если навести мышку на соответствующие столбы графика, данные цифры показываются. На бумажном голосовании такое в принципе не возможно, но тут же электронное.

Если все эти 20 тысячи человек, которые пришли в этот час, переголосовали бы по пять раз, то получилась бы примерно такая картинка.

Но есть нюанс, в первых, в такое коллективное сумасшествие трудно поверить, а во вторых переголосовывать вроде бы можно "не чаще чем раз в три часа"[1] - то есть такого быть не должно.



То есть либо это глюк сайта, либо имели место какие-то стахановцы, которые голосуют раньше, чем получают бюллетень. Как это проверить?

Можно скачать дамп базы данных с того же сайта, есть большая кнопочка это предлагающая сделать. https://observer.mos.ru/1/dump/observer-20210921_143000.sql.gz - ссылка то работает, то нет, не знаю почему, иногда предлагается более новый дамп от 26 числа для скачивания, но тогда архив оказывается обрезанным 1.8Гб и не открывается. Но если удача на нашей стороне, то архив сохраняется и распаковывается нормально.

По базе данных можно легко подсчитать, что 22219 действительно выдано и 103339 действительно получено, то есть график правильный. Sql запросы к базе данных высветятся, если навести мышку на числа.

Получив доступ к базе данных, можно строить различные графики, на пример, как менялось число выданных и полученных бюллетеней в течении первого часа:



4 - это выдача бюллетеней, 5 - проверка доступа избирателя, 6 - приём бюллетеня от избирателя. Нижняя шкала это секунды, вертикальная число транзакций. Шесть и пять графики практически совпадают, разница в десятки бюллетеней не видна в масштабе десяток тысяч.

Посередине часа с 20 минуты до 35 нет никаких транзакций данных типов.
После бюллетени выдавались очень неактивно, 4848 штук за почти пол часа, а вот количество проголосовавших выросло на 73787 человека.
Основная часть выданных бюллетеней пришлась на пятиминутку между 15-20, их неожиданно 12506, что сравнимо с числом выданным за весь час.

Вывод

1. начальные часы, когда переголосование должно было быть неактивным, а активность избирателей тем не менее была пиковой лучше всего подходят для выявления аномалий
2. система электронного голосования явно вела себя некорректно за рассматриваемый период, то отключаясь, то неожиданно активируясь
3. периоды активации по выдаче бюллетеней никак не коррелируют с периодами их принятия и наоборот
4. почему-то система позволяла голосовать тем, кто не получал бюллетени
5. за весь рассмотренный период число проголосовавших явно превалировало на числом получивших право голосовать в разы, что не имеет рационального объяснения, кроме вероятного вброса или совершенно некорректного режима работы системы, исключающий возможность хоть какого-то доверия результатам.

PS. Я почти десяток лет слежу за выборами на своём родном участке, и исходя из своего опыта, могу сказать одно вброс ловиться ТОЛЬКО по книгам, без доступа к спискам избирателей вброс не ловиться совсем. Любой подсчет или переподсчет или перепереподсчет содержимого избирательных урн выявить такие махинации не может в принципе. Стопки аккуратно сложенных бюллетеней в урне для голосования одинаково заполненных лишь очень косвенный признак, который исчезает уже после первого подсчета. Электронное голосование без контроля списков допущенных смысла в принципе иметь не может.
Чернобурка

ДЭГ в Москве по одномандатным округам, первый час динамика


4 - это получение бюллетеней, 5- проверка доступа избирателя, 6 - приём бюллетеня. Нижняя шкала это секунды, вертикальная число транзакций. Шесть практически не видно, так как совпадает с пять очень точно.

Посередине часа с 20 минуты до 35 нет никаких транзакций данных типов.
После бюллетени выдавались очень неактивно, 4848 штук за почти пол часа, а вот количество голосующих выросло на 73787.
Основная часть выданных бюллетеней пришлась на пятиминутку между 15-20, их неожиданно 12506.
Чернобурка

ДЭГ в Москве по одномандатным округам, первый час

Гы, а у них в базе данных тоже самое, что и на сайте. Берём linux и прямо в bash фигачим команды:

wget https://observer.mos.ru/1/dump/observer-20210921_143000.sql.gz - качаем старый дамп, который они уже не предлагают для скачивания, а вместо него какой-то обрубок дают не открывающийся на https://observer.mos.ru/all/servers/1/txs.

echo "CREATE DATABASE testdb2;" | psql -U postgres -h localhost - создаём пустую базу данных
zcat observer-20210921_143000.sql.gz | psql -U postgres -h localhost -d testdb2 - распаковываем его прямо в postgres базу данных.

echo "SELECT count(*) FROM transactions where method_id=4 and status->>'type' = 'success' and datetime<timestamp '2021-09-17 09:00:00';" | psql -U postgres -h localhost -d testdb2 - считаем количество успешных транзакций четвертого типа (выдача биллютеня) за первый час
count
-------
 22219
(1 строка)




echo "SELECT count(*) FROM transactions where method_id=6 and status->>'type' = 'success' and datetime<timestamp '2021-09-17 09:00:00';" | psql -U postgres -h localhost -d testdb2 - считаем количество транзакций шестого типа (приход зашифрованного биллютеня от избирателя) за первый час голосования
count
--------
 103339
(1 строка)


и цифры тютелька в тютельку именно те, что на сайте.

Они за первый час накидали 80 тысяч биллютеней или могуть быть какие-то другие версии?
Чернобурка

ДЭГ в Москве по одномандатным округам

Что бы понять чего стоит ДЭГ в Москве достаточно взглянуть на первых два столбца на этом графике:

Скриншот c https://observer.mos.ru/all/servers/1/txs:

- что бы увидеть эту картину нужно сдвинуть ползунок внизу до 17 сентября, которое по умолчанию не показывается.

Они утверждают, что с 8 утра 17 числа до 9 утра они выдали 22219 бюллетень, при этом приняли 103339 бюллетень, почти в пять раз больше. Это было бы возможно, если все эти 22 тысячи человек переголосовали бы по пять раз, но в первых в такое сумасшествие коллективное трудно поверить, а во вторых переголосовывать вроде бы можно "не чаще чем раз в три часа"[1] - то есть в первый час проголосовать можно только один раз.

Как сие объяснить кроме как вброс? Вероятно речь о каком-то техническом сбое на сайте, ибо dump базы данных у них битый сейчас выдаётся для одномандатного округа.