5 минут

Две статистики

Что вообще такое статистика? Сам термин искусственного происхождения. Введён в оборот Ахенваллем Готфридом, который заменил название курса, который он преподавал в университете с "Государствоведение" на "Статистика". И тут логичен вопрос, а какая связь между вроде бы математической дисциплиной и государственными делами? А ответ очень прост. Письменность, государство и статистика возникают одновеременно. Первые записи человечества по сути храмовые долговые расписки. Процитирую:


В крупных храмовых хозяйствах было много жрецов, которые специально занимались измерением земельных участков, организовывали прокладку каналов, вели счет собственному урожаю. Именно храм управлял жизнью соседних городов и деревень, собирал с населения подати, раздавал еду в голодные годы. Хозяйственная деятельность храмовой общины обусловила необходимость ведения учета. Самые ранние записи принадлежат храмовым чиновникам. Они должны были считать, сколько зерна, масла, мяса произведено в хозяйстве, сколько выдано работникам на пропитание, сколько осталось в распоряжении храма. Кроме того, чиновники вели учет сделок на продажу земли и прав собственности на имущество.


Как там было у В.И. Ленина в работе "Как организовать соревнование":


Учет и контроль за количеством труда и за распределением продуктов — в этом суть социалистического преобразования.


Формирование статистики и есть учет и контроль. Поэтому, статистика есть основа для понимания процессов идущих в государстве, в крупных человеческих коллективах, на производстве, да везде! Ахенвалль, выводя статистику из государствоведения с одной стороны закладывал основы для отстранённого научного анализа численных данных и развития статистического инструментария. А с другой стороны выбивал смысловую часть из статистики, отдаляя от специалистов понимание зачем вообще нужна статистика.


Те кто говорят, что статистика это раздел математики не правы. Государственные чиновники реализуя колоссальную потребность в учете и контроле создают статистику, а уже потом, философы анализируя эту практику создают математику. Так, что правильнее говорить, что математика раздел статистики. ?


Давайте внимательнее посмотрим на приведенную выше Ленинскую философскую формулу. С одной стороны учет и контроль, а с другой стороны преобразование. Отсюда становится понятно почему статистика делится на описательную статистику (учет и контроль) и статистику выводов (преобразование). Начнем с описательной статистики.


В этом месте обычно начинается красочный рассказ о терминах на примере зайчиков, котиков или рыбок для наглядности. Иногда с рисунками. Тут тема не нова и есть много хороших и наглядных книг. Есть даже манга. В общем, человеческий ум в стремлении подать материал о базовых статистиках максимально доходчиво проделал огромную работу. В общем не будем повторяться. Поэтому, основные термины рассмотрим исторически.


Представьте, Вы царь древнего Вавилона. И ваша задача - сформировать бюджет. И с этой целью Вы организуете первую в истории систему налогообложения. И какие вопросы Вам нужно для этого ответить?


Вопросы по налоговой базе:

  • сколько человек живет в моем царстве?
  • как население распределено по территории?
  • какая производительность труда у моих поданных по различным отраслям?
  • как производительность труда распределена по регионам?


Вопросы налоговой нагрузки:

  • сколько собирать налогов с населения, чтобы оно не умирало с голоду?
  • как распределить нагрузку по отраслям и регионам?
  • в какой форме взымать налоги?
  • как собирать налоги с торговцев, чтобы они не проезжали мимо моего царства?


Вопросы собираемости налогов:

  • собираются ли налоги в полном объеме?
  • сколько из собранных налогов доезжает до моей казны?


Прониклись масштабом задачи? Именно ввиду масштаба задачи Вы предпринимаете невиданное ранее действо - перепись всего населения царства. На языке статистики все население это генеральная совокупность. Обладая царской властью Вы можете работать с генеральными совокупностями т.е. изучая все население в целом. При этом это чудовищно дорого и очень долго! Но у Вас есть умные подданные. К Вам приходит жрец и предлагает - давайте делать перепись не каждые пять лет, а раз в пятьдесят лет, но ежегодно делать выборочные переписи т.е. оценивать все население (генеральную совокупность) по выборке. При правильной организации выборок мы практически не теряем в точности, но при этом экономим много ресурсов.


Но генеральная совокупность и выборка это не одно число, а набор чисел. В государственном масштабе это очень очень много чисел. Поэтому, много цифр заменяются на интегральные характеристики: центр (среднее, медиана, мода) и разброс (среднеквадратическое отклонение, межквартильный размах). Есть и другие интегральные характеристики, про них детально в инструментальной части. Интегральные характеристики позволяют смотреть на выборку в целом, что открывает широкий простор для анализа. Это в том числе и анализ динамики изменения выборок во времени.


И вот Вам приносят итоги переписи. Вы их просматриваете и видите, что в провинции А живет в два раза больше людей, чем в провинции Б. Но налогов с этих провинций приходит одинаково. Почему так? В провинции А вороватые чиновники? Там был неурожай? Провинция А пограничная и там больше ресурсов тратится на оборону? Или еще что? И в зависимости от того, какой ответ верен, Ваши действия будут разные. А в поиске правильного ответа помогает статистика выводов. Статистика выводов это разнообразные инструменты анализа гипотез, математического моделирования, планирования и анализа экспериментов.


На этой статье заканчиваем вводную философскую часть и переходим к инструментальной части.

Бесплатный
Комментарии
Здесь будут комментарии к публикации