All your base are belong to us!
По статистике 95% людей даже не задумываются откуда берутся цифры после слов «по статистике».
26.08.2014 в 17:59
Пишет dration:Nothing specia about Thursdays
Dataisbeautiful принесла прекрасный график иллюстрирующий, почему опираться на статистику без понимания story behind the quantity абсолютно бесполезно.
![](http://i.imgur.com/hFpPZYS.png)
Что говорит нам статистика? Что женщины в США почти не рожают 1 и 2 января, а также по субботам и воскресеньям. Я бы тут могла написать издевательских выводов об особенностях женской физиологии, которая, оказывается, подчиняется циклу рабочей недели, а также почему-то дню святого валентина. Но не буду.
История за границами цифр тут очевидна: нет никаких физиологических или биологических причин для того, чтобы не рожать в субботу ли воскресенье. Более того роды — это такое явление которое естественным образом перенести или приостановить нельзя, и оно не зависит от желания женщины.
А что же есть? Тут тоже всё очевидно: персонал в госпиталях уходит на выходные, поэтому плановые кесаревы, а также стимулированные роды не назначаются на субботу и воскресенье. Высокая доля вторников тоже понятна: стимулированные роды назначаются так, чтобы к выходным женщина уже была дома. То что мы видим по выходным - это либо экстренные кесаревы либо естественные роды (домашние или в клинике).
[мне, как человеку знакомому с вопросом этот график рассказывает также о распространении со временем практики стимулирования родов, но в данном случае это не существенно]
Если нам нужно узнать о том, есть ли какая-то физиологически обоснованная зависимость между родами и конкретным днем недели эта статистика нам не подойдёт, из неё придётся выбрать только случаи естественных нестимулированных родов (не уверена что такая статистика вообще доступна).
Это я к чему? Если смотреть на цифры и не понимать сути явлений, которые статистика описывает то из статистики возможны самые абсурдные и оторванные от реальности выводы, вроде вышеупомянутых физиологических особенностей позволяющий не рожать в выходные - вот есть же месячный цикл в принципе почти совпадающий с календарным месяцем, почему не может быть какого-нибудь недельного процесса совпадающего с календарной неделей, днем святого валентина, новым годом, днем независимости и так далее))
Статистика не дает реальных знаний. Никогда. Это только цифры. Не более. Очень полезные цифры, позволяющие научным образом доказать или опровергнуть гипотезы, но гипотеза это всегда результат изучения процессов, приводящих к определенным численным результатам а не изучение цифр. Статистические данные мощный инструмент только тогда он приложен к знаниям, заменить их она не может и, что самое важное - дать знания о процессах она тоже не может.
Картинка содержит ещё один чудесный пример того, почему статистика без знаний ничего не даёт: пик в четверг, 9 сентября 1999 года. Если бы мы взяли в качестве показатель усреднённые доли родов на день недели по выборке 1999 года (ну вот скажем не было бы у нас данных за другие года) то на средний четверг пришлась бы гораздо большая доля, чем в усреднённых данных по любому другому случайному году. С точки зрения цифр это бы значило, что в четверге есть нечто очень особенное (или что в четвергах 1999 года есть что-то очень особенное), а вот нет - есть просто статистическая аномалия, которая конечно объясняется числами (09 09 1999), но вовсе не в их статистическом смысле. Особенное было в конкретной дате, а то что она выпала на четверг в данном случае событие псевдослучайное. Ничего особенного в четвергах. Понимаете?
Домашнее задание: с учётом того что физиология женщин и длительность вынашивания у людей не зависит от географии, национальности, гражданства и расы, можем ли мы использовать данные графики для прогнозирования вероятности родить в определённый день недели для гражданки Конго, ОАЭ, России и Израиля постоянно проживающих в этих странах. Почему нет?
URL записиDataisbeautiful принесла прекрасный график иллюстрирующий, почему опираться на статистику без понимания story behind the quantity абсолютно бесполезно.
![](http://i.imgur.com/hFpPZYS.png)
Что говорит нам статистика? Что женщины в США почти не рожают 1 и 2 января, а также по субботам и воскресеньям. Я бы тут могла написать издевательских выводов об особенностях женской физиологии, которая, оказывается, подчиняется циклу рабочей недели, а также почему-то дню святого валентина. Но не буду.
История за границами цифр тут очевидна: нет никаких физиологических или биологических причин для того, чтобы не рожать в субботу ли воскресенье. Более того роды — это такое явление которое естественным образом перенести или приостановить нельзя, и оно не зависит от желания женщины.
А что же есть? Тут тоже всё очевидно: персонал в госпиталях уходит на выходные, поэтому плановые кесаревы, а также стимулированные роды не назначаются на субботу и воскресенье. Высокая доля вторников тоже понятна: стимулированные роды назначаются так, чтобы к выходным женщина уже была дома. То что мы видим по выходным - это либо экстренные кесаревы либо естественные роды (домашние или в клинике).
[мне, как человеку знакомому с вопросом этот график рассказывает также о распространении со временем практики стимулирования родов, но в данном случае это не существенно]
Если нам нужно узнать о том, есть ли какая-то физиологически обоснованная зависимость между родами и конкретным днем недели эта статистика нам не подойдёт, из неё придётся выбрать только случаи естественных нестимулированных родов (не уверена что такая статистика вообще доступна).
Это я к чему? Если смотреть на цифры и не понимать сути явлений, которые статистика описывает то из статистики возможны самые абсурдные и оторванные от реальности выводы, вроде вышеупомянутых физиологических особенностей позволяющий не рожать в выходные - вот есть же месячный цикл в принципе почти совпадающий с календарным месяцем, почему не может быть какого-нибудь недельного процесса совпадающего с календарной неделей, днем святого валентина, новым годом, днем независимости и так далее))
Статистика не дает реальных знаний. Никогда. Это только цифры. Не более. Очень полезные цифры, позволяющие научным образом доказать или опровергнуть гипотезы, но гипотеза это всегда результат изучения процессов, приводящих к определенным численным результатам а не изучение цифр. Статистические данные мощный инструмент только тогда он приложен к знаниям, заменить их она не может и, что самое важное - дать знания о процессах она тоже не может.
Картинка содержит ещё один чудесный пример того, почему статистика без знаний ничего не даёт: пик в четверг, 9 сентября 1999 года. Если бы мы взяли в качестве показатель усреднённые доли родов на день недели по выборке 1999 года (ну вот скажем не было бы у нас данных за другие года) то на средний четверг пришлась бы гораздо большая доля, чем в усреднённых данных по любому другому случайному году. С точки зрения цифр это бы значило, что в четверге есть нечто очень особенное (или что в четвергах 1999 года есть что-то очень особенное), а вот нет - есть просто статистическая аномалия, которая конечно объясняется числами (09 09 1999), но вовсе не в их статистическом смысле. Особенное было в конкретной дате, а то что она выпала на четверг в данном случае событие псевдослучайное. Ничего особенного в четвергах. Понимаете?
Домашнее задание: с учётом того что физиология женщин и длительность вынашивания у людей не зависит от географии, национальности, гражданства и расы, можем ли мы использовать данные графики для прогнозирования вероятности родить в определённый день недели для гражданки Конго, ОАЭ, России и Израиля постоянно проживающих в этих странах. Почему нет?