в среднем по стране
Wednesday, 1 Apr 2009
Приходит мужик в парикмахерскую, постригли его, и парикмахер спрашивает:
— Где вам сделать пробор?
— Посередине, пожалуйста.
— Это невозможно.
— Почему?
— У вас нечетное количество волос.
© РНА
Проснешься бывает с утра, откроешь ленту — а там опять отзывы домохозяек с неосознанным высшим филологическим об опросах, проводимых домохозяинами с неполученным средним специальным. Такое ощущение, что даже у результатов опроса «есть ли жизнь на Марсе», проведенного среди стационарных пациентов Ганнушкина — будет своя восхищенная аудитория, которая будет апеллировать к результатам, как к Священной Истине.
У меня складывается впечатление, что математиков и статистиков специально выгоняют из агентств, специализирующихся на опросах — и заменяют их на пиарщиков. Остается непонятным, зачем вообще выходить на улицы и отвлекать спешащих по своим делам людей, если средняя домохозяйка будет восхищена любым фантастическим результатом, а любой десятиклассник сразу поймет, что налицо явная, допускаю, что неумышленная, фальсификация.
Чтобы понять, имеет ли смысл вообще обращать внимание на результаты любого опроса достаточно взглянуть на средние по больнице. Хрестоматийный пример с интернет-опросом «пользуетесь ли вы интернетом» — наверное, самый яркий. Но и подавляющее большинство остальных — результатами — способны вызвать только смех сквозь слезы.
Опрос «Каков средний уровень доходов россиянина», проведенный в Москве. «Процент курящих среди населения» — в ирландском пабе. «Как давно вы ведете блог» со средним возрастом респондентов — 31 год. Это все примеры из жизни.
Поясню на совсем простом примере, почему любые усреднения — очень опасная штука. Он покажется слишком очевидным людям, хотя бы поверхностно знакомым со статистикой. Тем удивительнее, какое огромное количество людей вообще не понимают, что такое это пресловутое «среднее».
Допустим, вам 30 лет. И вы заинтересовались опросом про «средний возраст блоггера». Если кроме вас в опросе приняло участие еще четыре человека, и средний возраст оказался равным двадцати восьми — что это значит?
Возможно, это еще три ваших ровесника и один тинейджер. Может быть, все остальные — около полугода назад отметили свое двадцатисемилетие. Не исключен также вариант, что организаторам попался один пенсионер и три семиклассника.
Это совсем разные аудитории, правда? Судя по среднему, в этом блоге вам будет интересно. Третий пример с очевидностью показывает, что такой вывод делать по меньшей мере преждевременно.
Я готов услышать возражение: в опросе всегда принимает участие гораздо больше пяти участников, и выборка становится репрезентативна. Это ложный довод. Достаточно взглянуть на пример с опросом в Москве — хоть все двадцать миллионов опроси, результат будет — мягко говоря — не совсем верным. Ну или просто экстраполируйте мой пример с одного пенсионера и трех семиклассников — на тысячу пенсионеров и три тысячи семиклассников (это ведь именно они обычно имеют возможность ответить на телефонный звонок дома в четыре часа дня).
Репрезентативность выборки означает гораздо бóльшее, нежели просто достаточное количество респондентов. Количество факторов, по которым должна соблюдаться эта самая репрезентативность — огромно и для каждого опроса — свое. И у меня складывается ощущение, что если бы результаты каждого опроса были достоверны, а выборки действительно репрезентативны — все эти социологические институты давно бы позакрывали к едрене фене.