Миграция из Армении. Опыт моделирования
В продолжение темы демографии Кавказа. Я написал о населении Грузии в 2017 году и демографии Армении в 2017 году. Сейчас я рассмотрю один из аспектов демографии – миграцию. Поскольку миграция более узкая тема, чем демография, можно будет ее рассмотреть в более широком временном интервале, чем демографию в целом. Основные данные о демографии за 2017 год уже опубликованы, что позволило написать этот текст.
Экономические факторы миграции – оценка влияния
В марте 2015 года я опубликовал некоторые результаты своего исследования по внешней миграции в Армении – «Экономические факторы миграции населения Армении» (английская версия также доступна - http://c-i.am/wp-content/uploads/policy-brief-03_2015_en.pdf).
Используя теоретическую рамку Эверетта Ли (статья «A Theory of Migration». журнал Demography, 3(1), 1966, стр. 47–57), я попытался реконструировать миграционные тренды на основании экономических и всех прочих данных. В частности, я проверил взаимосвязь между темпами роста экономики и динамики нетто-миграции. Оказалось, что связь есть и в случае Армении она очень прямо выражена. Грубо говоря, чем выше темпы экономического роста, тем меньше уезжают из Армении, и наоборот. Это выражено еще больше, если применить тот или иной способ усреднения темпов экономического роста с использованием динамики прошлых лет.
В частности, статистическое исследование показало, что наиболее эффективен такой подсчет при использовании динамики за 3 прошедших года, причем так, чтобы наибольшее значение придавалось последнему году, а наименьшее – самому раннему из трех лет. Изначально я применял формулу:
Эта формула родилась опытным путем и довольно логична. Корреляция такого взвешенного за три года роста ВВП оказывалась очень высокой, на уровне 0.92-0.94, то есть, по сути, одного этого фактора достаточно для того, чтобы описать принципиально динамику миграции. У этой формулы есть один несомненный плюс – она в принципе универсальна и ее можно использовать для разных ситуаций, где нужно сгладить отдельные временные колебания.
Однако мне эта формула не очень нравилась, поскольку соотношение влияния текущего и прошедших лет на самом деле не было статичным. Один раз я попробовал рассмотреть изменяющееся соотношение влияния текущего и прошлых лет на миграционную динамику таким образом, чтобы просто с каждым годом влияние прошлых лет увеличивалось, а текущего соответственно снижалось линейно. Бинго: самое простое линейное изменение соотношения повысило корреляцию.
Линейное изменение соотношения нужно было заменить чем-то более приличным и логически полностью выверенным и на это у меня было три варианта:
- Индекс ВВП (в % к 1988 году)
- Доля торговли продовольственными товарами (в % от всей розничной торговли)
- Соотношение подушевого ВВП Армении и развитых стран
Все три показывают похожие тренды: горизонт планирования потенциального мигранта растет и тот при отъезде все больше учитывает не только ситуацию текущего года, но и ситуацию прошлого, а также, позапрошлого года. Таким образом, потенциальный мигрант не банально сидит на чемоданах в ожидании дуновения ветерка, а имеет какой-то запас прочности и времени на принятие решения.
Индекс ВВП может иметь значение потому, что люди подсознательно за точку отсчета принимают наивысший уровень экономического развития, достигнутый в Советском союзе, поскольку это та точка, от которой они в свое время рассчитывали отталкиваться в сторону повышения уровня жизни. В общем, это такая планка, «золотой стандарт». В этом случае за 27-летний интервал корреляция составит 0.9416. Проблема с этим индексом в том, что он предполагает некую линейную зависимость миграционных настроений в зависимости от уровня экономического развития, достигнутого в позднекоммунистическую эпоху, однако по мере удаления от 1989 года, это теряет актуальность, поскольку все более многочисленными становятся поколения, выросшие уже в независимой Армении и не способные даже на субъективном уровне восприятия сравнить ситуацию с позднесоветской.
Относительный уровень жизни и эмиграция
Доля торговли продовольственными товарами имеет значение, поскольку является косвенной характеристикой уровня бедности в стране. Если уровень жизни населения растет, то это в первую очередь будет сказываться на росте потребления непродовольственных товаров. Самое интересное – то, что во многих развитых и развивающихся странах расходы на пропитание почти такие же, как и в развитых (если не считать потребление еды вне дома). Это означает, что из каждого нового заработанного доллара большая часть пойдет не на пропитание, а на другие товары. Единственное, здесь невозможно сравнивать с бывшим Советским союзом, где структура потребления, а также номинал товаров, доступных для потребления, в том числе продуктов питания, был неизмеримо уже. В данном случае корреляция за 27-летний интервал составляет 0.9484.
Рассчитано по формуле:
где E – расчетный экономический показатель, ft = доля продовольствия в общем объеме торговли за период t. Столь высокая корреляция позволяет без привлечения каких бы то ни было дополнительных данных делать предсказания о динамике миграции в будущем. С некоторыми оговорками, о которых я позже поговорю.
Пока же рассмотрим точечную диаграмму, где видна зависимость миграционной динамики от рассчитанного нами экономического показателя. Почти все точки находятся очень близко к линии тренда.
Основной минус Ef в том, что долю продовольственных расходов в объеме торговли я еще планирую использовать для других расчетов, в частности, для определения степени влияния экономической динамики на миграционную динамику относительно прочих факторов (сопутствующие обстоятельства в виде ситуации в стране-реципиенте миграции – России и политических факторов).
Наконец, соотношение текущего подушевого ВВП Армении и развитых стран имеет тот смысл, что учитывается не только ситуация в стране – миграционном доноре, но и в странах реципиентах миграции. Ведь «бедность» и «богатство» - категории исключительно относительные и та страна, которая считалась богатой 2000 лет назад, сегодня будет считаться бедной. Именно это мне показалось наиболее логически выверенной позицией, хотя и получилась самая низкая корреляция – 0.9336. «Страны ОЭСР с высоким доходом» (который использовал как бенчмарк для богатых стран), категория не столь ясная, как отдельные страны, да и там существуют статистические проблемы при подсчете, не говоря уже о том, что динамика экономической ситуации во Франции оказывает на миграцию в Армении гораздо большее влияние, чем ситуация в Германии, а ситуация в России оказывает больше влияния, чем ситуация во всех странах ОЭСР вместе взятых. Тем не менее, если предположить, что ориентиром для граждан Армении является уровень экономического развития стран развитого мира, то это все еще должно быть релевантно.
Это выглядит следующим образом:
Данный подход предоставляет логически выверенное объяснение, почему со временем снижается зависимость миграционной динамики от текущей экономической ситуации и растет зависимость от прошлогодней и даже позапрошлогодней динамики. Графически эту взаимосвязь можно отобразить следующим образом. Разброс чуть-чуть дальше от линии тренда, чем на прошлом графике, но по-прежнему вполне прилично.
Сравнительно более низкий уровень корреляции не должен смущать, поскольку задача не в том, чтобы добиться максимальной корреляции в конкретном случае, а чтобы модель имела максимальную объяснительную силу. Колебания и отклонения в будущем помогут объяснить прочие показатели.
Безработица
Я пробовал использовать разные показатели, характеризующие уровень жизни, к примеру, динамику конечного потребления / конечного потребления домашних хозяйств, извлеченную из национальных счетов, но натолкнулся на серьезные проблемы с качеством данных и, поскольку, я эти проблемы еще не сумел решить, не буду на этом очень сильно фокусироваться. Используя те данные, что были доступны официально, а также некоторую коррекцию их результатов, я все еще получал высокую корреляцию на уровне 0.7-0.8, но это явно не то. Сама динамика миграции указывает на то, как менялся уровень потребления, а значит, здесь нужны гораздо более точные данные (как известно в статистике, garbage in – garbage out, что, к сожалению, касается очень большой доли публикаций по экономической статистике).
Данных по безработице за весь период не существует. Армения по меньшей мере два раза меняла методологию расчета безработицы и с 2008 года используется методология Международной организации труда (ILO), но для ее сопоставимости с предыдущими данными пришлось использовать экспертную оценку на основании данных, представленных в IMF World Economic Outlook 2017. Оценочные данные, использованные для расчета, представлены на графике:
На основании этих данных и с использованием уже имеющихся индексов, можно составить индекс, который сочетал бы, к примеру, взвешенные темпы роста ВВП за 3 года темпы роста ВВП на основе экономического отставания от развитых стран, а также динамики и текущего состояния безработицы, как основной выталкивающей силы миграции, можно составить формулу для итогового экономического индекса.
Корреляция полученного индекса с коэффициентом миграции составила 0.9446 для периода 1991-2017, 0.9497 для периода 1992-2017 (стоит учитывать, что все данные за 1991 год недостаточно точны), и 0.74393 для периода 1996-2017. Именно последняя цифра очень важна, поскольку, учитывая огромный отток населения в начале 1990-ых, корреляция выходит очень высокой на всем временном отрезке, но в период более скромных объемов эмиграции, эта корреляция во всех случаях снижалась довольно заметно. Для качественной модели, обладающей ценностью для построения прогнозов, в действительности, необходимо получение максимально высокой корреляции именно на этом отрезке. Возможно, в будущем нужно будет добавить динамику реального размера зарплат, думаю, это повлияет на точность модели, как минимум сгладит ситуацию с 2009-2010 гг., когда модель ожидает резкого ухода в минус в 2009 году, а он случается в 2010.
Данные
В двух словах необходимо коснуться проблемы данных. По анализу совокупности макроэкономических показателей, вышло, что официальные данные по динамике ВВП до 1997 года не могут считаться достоверными, тогда как данные за последующий период обладают достаточно высокой степенью достоверности, хотя, вероятно и потребуют в дальнейшем пересмотра, особенно с учетом сельскохозяйственной динамики. Но этот пересмотр, вероятно, повлияет на процент прироста в размере не более ±0.5%, что, учитывая гораздо более существенные расхождения в 1980-е и особенно в 1990-е, не так уж принципиально.
Поэтому здесь использовались те же данные по динамике ВВП, что представлены на графике 1 в посте про историческую динамику армянской экономики. Сами данные, пока я еще не закончил работать над ними, являются предварительными и поэтому не публикуются.
Кроме того, переоценена динамика миграции на основании данных о сальдо пограничного пассажирооборота,
Результаты
Формула для предсказания динамики миграции на основании экономических факторов с использованием этой простой модели парной линейной регрессии (специально не использовал множественную, поскольку статистические методы тоже имеют определенный предел), выглядит на данный момент так:
Сравнение динамики миграции, имевшей место в действительности, и результатов моделирования, за период 1991-2017 гг. Представлены результаты по двум моделям, одна из них включает в себя политический индекс и сопутствующие миграции факторы. Об этом позже и отдельно.
Наконец, краткий комментарий. Как видно, серая линия несколько ближе к синей, чем оранжевая, поскольку модель с учетом политических и промежуточных факторов оказалась более точной. Но в действительности, обе модели угадывают принципиальные тренды с точностью в худшем случае 1.5% населения (они должны угадать миграционное поведение всего населения, а не только уезжающих). Стандартное отклонение около 0.3%, то есть 8500 человек. Что самое главное, модели хорошо совпали с динамикой 2016 и 2017 года.
Модель, основанная на экономической динамике (представленная в этом посте) предсказала -30,240 человек, в реальности сальдо пассажиропотока -26,900 в 2017 году, а в 2016 году она предсказала -48,780 человек, а в реальности было -48,170 человек. В 2015 году разница была чуть больше - ожидаемое -41,510, реальное -43,440.