Привет!

Не каждый может парсить данные, как grok.se, т.к. логи посещаемости - это файлы размером в сотни мегабайт за каждый час работы серверов, и обрабатывать их можно только на хорошей площадке. Для того же stats.grok.se последние серверы уже Фонд покупал, и смысла изобретать велосипед для наших локальных целей нет, как нет и ресурсов на это. Собственно, поэтому никто за это время аналогов ему и не создал.

Часть про политику конфиденциальности я пропущу, т.к. это не вопрос общения с разработчиками Фонда, а вопрос обсуждения самой политики - на данный момент она ставит своей целью сбор минимальных данных о пользователе и несмотря на то, формальное это заявление или нет, оно есть, и обойти его я не могу.

На рекламу Гугла мы тратим не условные 100 рублей с необходимостью получения 100+ рублей дохода, а ноль (!) рублей. Поэтому даже условная копейка отдачи - это прибыль (если опускать в сторону вопросы эффективности).

Я не могу ставить прямой ссылкой в рекламе линк на форму пожертвований - она не несет информации о нашей деятельности, не говорит, зачем нам нужны деньги, поэтому такая реклама рискует окончиться блокировкой моего аккаунта.

Нам нужна нормальная landing page, которая будет вкратце показывать, чем мы занимаемся, зачем нам деньги и прямо показывать, как эти деньги перевести. Лично я и веду свою работу в этом ключе: обновление заглавной сайта, сбор какой то статистики - это все шаги по превращению заглавной ru.wikimedia.org в нормальную landing page, которую Гугл будет эффективно рекламировать. Мое желание начать играться с таргетированным баннером CentralNotice на заглавной - тоже из этой серии.

К тому же я проводил мини-опросы знакомых перед тем, как устанавливать страницу, на которую поведет реклама: когда человек из поисковика переходит на donate.wikimedia.ru, где с него сразу просят какие-то деньги по какому-то договору куда-то перевести, - подобного желания у него не возникает. Когда же человек видит наш сайт (на котором в идеале глаз читателя будет сразу видеть информацию о том, кто мы и зачем нам деньги) - то шанс получить деньги возрастает. Я не говорю, что главная ВМ-ру идеальна (и количество поступлений это доказывает), я говорю, что ссылка на форму пожертвований не будет лучше.

Линар

18.08.2014 12:54 пользователь "Alexander N Krassotkin" <krassotkin@gmail.com> написал:
Доброе!

2014-08-17 19:53 GMT+04:00 rubin.happy <rubin.happy@gmail.com>:
> По статистике я еще попробую что-нибудь сделать (например, поговорить с
> разработчиком stats.grok.se),

  А что с грок? Просто внешний сервер, который парсит дамп WMF. Это
любой может делать. Вопрос же не к ним. Кстати сейчас модный другой:
http://tools.wmflabs.org/wikiviewstats/

> просто значительная часть того, что нас
> интересует, упирается в конфиденциальность читателей:

  Это такая отмазка, не имеющая под собой оснований. Чтобы убедиться,
нужно выписать виды обычной групповой статистики и задать по каждому
пункту вопрос: Каким конкретно нашим условиям он противоречит и каким
образом.

  Например, групповые отчёты по:
- количество хостов/идентифицированных посетивших страницу (а не
хитов, как всю дорогу демонстрируют)
- конкретный урл, с которого юзер зашёл на страниц (а не просто домен,
по которому найти урл где на нас стоит ссылка не составляет труда, но
это лишние танцы с бубнами)
- пути по сайту (точки входа, переходы, точки выхода)
- страны из которых заходили на проект
- браузеры которыми пользуются
... и т.д. просто берёшь гугль аналитик и по списку спрашиваешь...

 Несколько раз в сеть попадали крупные дампы анализа статистики
больших сайтов. Они анонимизируют IP (куки, если есть) на первом этапе
- ставя ему в соответствие некий ID с общими параметрами (страна,
свойства браузера, например язык, и т.д). Далее же они хранят в базе
подробную инфу только по этому ID. Теоретически, имея доступ к базе
теоретически можно деанонимизировать ID, но речь идёт о групповых
отчётах, т.е. если ты смотришь количество ID, посетивших страницу,
деанонимизировать отдельный ID проблематично, аналогично, если
смотреть какие поисковые запросы и сколько ID их делало, также
вытащить кто это был в реальном мире крайне сложно.

  Большую часть из этой информации можно выдавать в дампе
сгруппированных отчётов, но в идеале это нужно делать через
собственный интервейс, тогда больше всего можно отразить без опаски
раскрыть информацию о конкретных ID.

> поэтому нам не дадут
> информацию, откуда конкретно пришли на конкретную страницу читатели, куда
> они потом ушли,

  зачем абстракции, нужно задавать конкретные вопросы по каждому
пункту - какому условию это противоречит и каким образом, а если не
противоречит, значит нужно делать

  мне, например, непонятно, как конкретные урлы, с которых к нам
переходили (потому, что на них стоят прямые ссылки), как-то
противоречат нашим условиям...

  если аккуратно анализировать, то получится, что в наших условиях нет
ничего, что бы противоречило созданию практически полнофункциональной
групповой статистики...

> что-то аналитического характера о самих пользователях, и
> многое другое, что могло бы быть интересно.

  Ладно, давай тогда в принципе.
  То что можно сделать сейчас написал выше, а эта часть не для
практических действий - она запросто утонет в обсуждениях, но понимать
её нужно. Может в будущем что-то прорастёт.

  Политика ВМ по конфиденциальности, как впрочем и подавляющего
большинства других проектов, - это обман пользователей и
предоставление им ложного чувства анонимности. Более того, ВМ -
первейший враг анонимности. Но дальше хуже - политика
"конфиденциальности" мало того, что является обманом и самообманом,
она противоречит нашим целям. Обосную.

  Например, я утверждаю, что любой админ Википроекта путём нехитрых
манипуляций может получить всю информацию о пользователях и это
непрерывно делается, чаще всего случайно, практически не выявляемо, и
всем на это плевать.
  Я сам однажды по запросу создал фичу, которую потом на голубом глазу
с благодарностью прикрутили без необходимой коррекции и только через
год сообразил, что могу через неё деанонимизировать вообще всех. Т.к.
мне эта информация не была нужна, я просто тихо поофигевал и забыл.
Через некоторое время её случайно "исправили", но не потому, что
поняли в чём прикол, а лишь в качестве "оптимизации". Сейчас той моей
возможности нет, но повторить её может каждый в любой момент.

  Или вот ещё более наглядно AddThis и любое "поделись" не теряет ни
единого байта информации за всю свою историю и открыто этими данными
торгует, а у нас оно иногда вообще в теле страницы появляется. Но даже
если это лишь ссылка, о какой анонимизации можно говорить, если мы
сознательно подсовываем юзеру брешь в его безопасности на всех
страницах.

  Или ещё больший разрыв шаблона - мы навечно сохраняем IP правки,
из-за которой его обладатель, например, в России может быть обвинён по
любому из массы законов (экстремизм, распространение, призывы и т.д.)
и тупо посажен за решётку. Но при этом мы стыдимся сохранить IP при
чтении страницы.

  Или с ником... вона НОВОРОССа (другие буквы) деанонимизировали
недавно по характеру его правок и кросс-информации, вообще вчистую.
Через пару часов не вставая с места теперь о нём можно узнать вообще
всё. Хоть письма бумажные по адресу с благодарностями посылай, за всё
то где он наследил и что сеть бережно сохранила. Ну и зачем этот цирк?
Зачем этот обман пользователей?

  Мы вообще первейшие враги анонимности и конфиденциальности, если уж
на то пошло. В каком ещё месте с таким упорством идиота ставят препоны
любым попыткам анонимизации, вместо того, чтобы придумать как с ними
жить.

  Google прав - ни о какой анонимности при регулярной работе в сети
речи вестись не может. Если хочешь анонимности, ходи со специально
заточенного для этого гаджета не из места своей основной локации и
после использования уничтожай его. В любом другом случае получить всю
информацию о пользователе дело лишь идей и времени.

  Поэтому вместо обмана юзеров на счёт их анонимности, следовало бы
менять политику конфиденциальности и общую политику (хотя бы по тем же
открытым проксям). Хочешь быть анонимным - будь, но на нашей стороне
это обеспечить невозможно. Мы и так навечно записываем и
распространяем IP при каждой правке, ничему не противоречит быть
последовательными и записывать IP при каждом посещении сохраняя это в
дампе. Ну а для зарегистрированных пользователей можно выдавать ник,
чего уж там. Или пойти по пути псевдоанонимного ID, что внешне будет
выглядеть благопристойней, а для обывателя менее напряжно.

  Вообще говоря, мы занимаемся свободным созданием и распространением
знаний. Статистика посещений - это кладез информации, необходимой и в
бизнес и научных целях. Её сбор и распространение запросто принесли бы
человечеству пользы, проектам - ориентировок и оптимизации, а ВМ -
дополнительного дохода. А мы с ней так безобразно обходимся.

>
> А про количество/качество еще философы говорили :)
> https://ru.wikipedia.org/wiki/Закон_перехода_количественных_изменений_в_качественные
>
> Поэтому совсем отрекаться от количественной нагонки просмотров при
> отсутствии прямого эффекта в донорах/участниках я не буду, авось что-то
> хорошее из этого выйдет - особых усилий от нас это не требует.

  Позволь выдвинуть следующую гипотезу, что реклама в Google даёт в
целом положительную отдачу заказчикам, иначе в конкурентной среде она
бы просто перестала существовать.
  Т.е. вложив 100 рублей, её использователь должен получить назад как
минимум 101 - т.е. какую-то "копеечку" чистого профита.
  Но мы не возвращаем даже 10% от вложенного, иначе это было бы
заметно в отчётах. У нас практически 100% бумажный убыток.

  Таким образом напрашивается вывод, что мы делаем что-то совершенно
не то и требуются принципиальные изменения.
  Например, для меня стало откровением, когда узнал, что ты посылаешь
пользователей не на форму, где они могут без лишних хлопот расстаться
со своими кровными ради благих целей, а на какое-то бла-бла на вики ВМ
РУ, и т.д.

  Нам дали неслабый в нашем положении ресурс, а мы его целиком
спускаем, по-другому результат оценить сложно.

  Если сами не умеем, давай привлечём специалистов, хоть за половину с
принесённого в результате этого дохода, но просто сидеть, ожидать чуда
и смотреть на выбрасывание таких шайб нельзя.

саша.

>
> Линар
>
>
> 17 августа 2014 г., 19:42 пользователь Alexander N Krassotkin
> <krassotkin@gmail.com> написал:
>>
>> Доброе!
>>
>> 2014-08-17 17:39 GMT+04:00 rubin.happy <rubin.happy@gmail.com>:
>> ...
>> > PS: А реклама в поисковике Гугла дает нам львиную долю переходов на
>> > сайт...
>>
>>   Ну это ещё отсюда было понятно (давал на форуме):
>> http://www.similarweb.com/website/ru.wikimedia.org
>>
>>   Только толку? Денег это не приносит, людей, желающих принять участие
>> в деятельности тоже.
>>
>>   А статистика, конечно, да... даже в прошлом веке у всех лучше была,
>> чем нам удётся выклянчить.
>>
>> саша.
>>
>>
>> >
>> > Линар
>> _______________________________________________
>> Wikimedia-RU mailing list
>> Wikimedia-RU@lists.wikimedia.org
>> https://lists.wikimedia.org/mailman/listinfo/wikimedia-ru
>
>
>
> _______________________________________________
> Wikimedia-RU mailing list
> Wikimedia-RU@lists.wikimedia.org
> https://lists.wikimedia.org/mailman/listinfo/wikimedia-ru
>
_______________________________________________
Wikimedia-RU mailing list
Wikimedia-RU@lists.wikimedia.org
https://lists.wikimedia.org/mailman/listinfo/wikimedia-ru