Методика математического моделирования программы развития сельскохозяйственного предприятия. Математические методы прогнозирования

Математические методы прогнозирования могут разрабатываться на основе различных функций, динамических рядов и аналитических зависимостей. Для математического моделирования и прогнозирования валютных рынков в качестве входной информации могут выступать как ценовая динамика и ее производные (значения индикаторов, значимые уровни и т.п.), так и рыночные макроэкономические показатели . В математических моделях прогнозирования финансовых временных рядов в качестве входной информации используется ценовая динамика. Однако иначе происходит работа с информационными моделями временных рядов, которые являются описаниями объектов-оригиналов с помощью схем, графиков, формул, чертежей и т.п. Одним из важнейших видов информационного моделирования является математическое, когда описания формулируются на языке математики. Соответственно, и исследование таких моделей ведется с использованием математических методов.

Математически задача прогнозирования валютного курса может быть сведена к задаче аппроксимации многомерных функций и, следовательно, к задаче построения многомерного отображения. В зависимости от типа выходных переменных аппроксимация функций может принимать вид: классификации или регрессии. Следовательно, в моделях прогнозирования валютных курсов можно выделить две крупные подзадачи: 1. построение математической модели; 2ю обучение экспертных сетей, реализующих решение задачи. В результате изучения предметной области должна быть разработана математическая модель прогнозирования, включающая набор входных переменных; метод формирования входных признаков и метод обучения экспертной системы.

Аналитические зависимости

Рассмотрим особенности модели прогнозирования на базе аналитических зависимостей.

Данная модель строится на основе анализа механизма образования валютного курса. Вид формулы в данном случае будет зависеть от характера и вида взаимодействующих факторов, влияющих на формирование валютного курса. За основу модели берется гипотеза о паритете покупательной способности . Далее в процессе рассмотрения реальных экономических систем добавятся новые факторы, и обобщенная модель выберет основные факторы, влияющие на образование валютного курса.

Повышение эффективности краткосрочных операций с валютой - одна из важных задач в деятельности банков и других инвесторов, которые продают и покупают различные валюты в значительных объемах, стремясь придать движение имеющимся в наличии свободным резервам, чтобы избежать потерь от конъюнктурных колебаний курсов и получить дополнительную прибыль. Причем валютные операции осуществляются с большой скоростью через Internet, так как очень важно выйти на валютный рынок с предложением раньше конкурентов. Все это – составная часть непрерывного процесса формирования оптимальной структуры валютных резервов.

Эффективность валютных операций существенным образом зависит от надежности прогнозов колебания курсов валют. Именно поэтому краткосрочное прогнозирование курсов имеет большое практическое значение для оперативной деятельности банков и прочих инвесторов. А вопрос о возможности применения статистических методов для этой цели представляется актуальным и естественным. Проблема краткосрочного прогнозирования курсов валют с применением статистических моделей рассматривается исходя из того, что для успешного ведения валютных операций требуется получение прогнозов на одни сутки вперед. Как, например, в фильме «Пи» математик Макс Коэн в течение многих лет пытается найти и расшифровать универсальный цифровой код, согласно которому изменяются курсы всех . По мере приближения к разгадке, мир вокруг Макса превращается в мрачный кошмар: его преследуют могущественные аналитики с Уолл-стрит, чтобы обнаружить код вселенского мироздания. Находясь на грани безумия, Макс должен сделать решающий выбор между порядком и хаосом и решить, способен ли он совладать с могущественной силой, которую сейчас пробудил его гениальный разум. Но это – фантастика. В реальности не тяжкий труд, а ход мысли определяет инвестиционный доход, при этом для оценки эффективности идеи может служить только адекватное математическое моделирование.

Адаптивные методы прогнозирования

Трудно провести четкую грань, отделяющую адаптивные методы прогнозирования от неадаптивных. Уже прогнозирование методом экстраполяции обычных регрессионных кривых содержит некоторый элемент адаптации, когда с каждым новым получением фактических данных параметры регрессионных кривых пересчитываются и уточняются. Через достаточно большой промежуток времени может быть заменен даже тип кривой. Однако здесь степень адаптации весьма незначительна; к тому же с течением времени она падает вместе с увеличением общего количества точек наблюдения и соответственно с уменьшением в выборке удельного веса каждой новой точки.

Последовательность процесса адаптации выглядит следующим образом. Пусть модель находится в некотором исходном состоянии, и по ней делается прогноз. Когда истечет одна единица времени (шаг моделирования), анализируем, насколько далек результат, полученный по модели, от фактического значения ряда. Ошибка прогнозирования через обратную связь поступает на вход системы и используется моделью в соответствии с ее логикой для перехода из одного состояния в другое с целью большего согласования своего поведения с динамикой ряда. На изменения ряда модель должна отвечать компенсирующими изменениями. Затем делается прогноз на следующий момент времени, и весь процесс повторяется. Таким образом, адаптация осуществляется интерактивно с получением каждой новой фактической точки ряда. Однако каковы должны быть правила перехода системы от одного состояния к другому, какова логика механизма адаптации?

В сущности, этот вопрос решается каждым исследователем интуитивно. Логика механизма адаптации задается априорно, а затем проверяется эмпирически. При построении, модели мы неизбежно наделяем ее врожденными свойствами и, вместе с тем, для большей гибкости должны позаботиться о механизмах условных рефлексов, усваиваемых или утрачиваемых с определенной инерционностью. Их совокупность и составляет логику механизма адаптации. В силу простоты каждой отдельно взятой модели и ограниченности исходной информации, зачастую представленной единственным рядом, нельзя ожидать, что какая-либо одна адаптивная модель годится для прогнозирования любого ряда, любых вариаций поведения. Адаптивные модели достаточно гибки, однако на их универсальность рассчитывать не приходится. Поэтому при построении и объяснении конкретных моделей необходимо учитывать наиболее вероятные закономерности развития реального процесса, динамические свойства ряда соотносить с возможностями модели. Необходимо закладывать в модель те адаптивные свойства, которых хватит для слежения модели за реальным процессом с заданной точностью.

Вместе с тем нельзя надеяться на успешную самоадаптацию модели , более общей по отношению к той, которая необходима для отражения данного процесса, ибо увеличение числа параметров придает системе излишнюю чувствительность, приводит к ее раскачке и ухудшению получаемых по ней прогнозов. Таким образом, при построении адаптивной модели приходится выбирать между общей и частной моделью и, взвешивая их достоинства и недостатки, отдавать предпочтение той, от которой можно ожидать наименьшей ошибки прогнозирования. Поэтому необходимо иметь определенный запас специализированных моделей, разнообразных по структуре и функциональным свойствам. Для сравнения возможных альтернатив необходим критерий полезности модели. Несмотря на то, что в общем случае такой критерий является предметом спора, в случае краткосрочного прогнозирования признанным критерием обычно является средний квадрат ошибки прогнозирования. О качестве модели судят также по наличию автокорреляции в ошибках. В более развитых системах процесс проб и ошибок осуществляется в результате анализа как последовательных во времени, так и параллельных (конкурирующих) модификаций модели .

Краткосрочное прогнозирование валютного курса

Информация о динамике курсов валют создает впечатление хаотического движения: падение и рост курсов сменяют друг друга в каком-то случайном порядке. Даже если за большой интервал времени отмечается тенденция, например, к росту, то на графике легко можно увидеть, что эта тенденция прокладывает себе путь через сложные движения временного ряда курса валюты . Направление ряда все время меняется под воздействием нерегулярных и часто неизвестных сил. Исследуемый объект в полной мере подвержен воздействию стихии мирового рынка, и точной информации о будущем движении курса нет. Необходимо сделать прогноз. При этом совершенно очевидно, что прогнозировать даже знак прироста курса очень сложно . Делать это обычно поручают экспертам, которые анализируют текущую конъюнктуру, а также пытаются выделить факторы, регулярным образом связанные с движением курса (фундаментальный анализ). При построении формальных моделей также пытаются выделить круг существенных факторов и на их основе сконструировать какой-либо индикатор, но ни эксперты-практики, ни формальные методы не дают пока хороших устойчивых результатов. Полагаем, объясняется это, прежде всего, тем, что если и есть действительно какой-либо круг факторов, влияющих стабильным образом на курс, то их воздействие надежно скрыто наложенной случайной составляющей и управляющими воздействиями .

В результате эти факторы и их влияние выделить довольно трудно. Поэтому необходимо считать краткосрочное прогнозирование курса по существу задачей прогнозирования последовательного движения изолированного временного ряда, причиной которого является главным образом массовое поведение на валютном рынке мелких и крупных финансовых игроков, совершающих основной объем финансовых операций с валютой. Такой подход можно отнести к . Конечно, отдельно взятый участник валютной игры волен совершенно произвольно менять свою стратегию. И все же можно предположить, что поведение всей массы участников через соотношение спроса и предложения, влияющее на курс валюты, обладает в текущий период времени какой-то определенной доминирующей логикой, обнаруживающейся через закон больших чисел. Например, при падении курса валюты ее могут скупать, ожидая в дальнейшем повышения курса. И такой массовый спрос валюты действительно ведет к росту ее курса. Или наоборот, если после падения курса валюты доверие к ней падает и ожидается ее дальнейшее обесценение, то преобладает массовое предложение и курс падает еще ниже. Заметим, что при таком упрощенном подходе саму динамику временного ряда можно прочитать как хронологическую запись о массовом поведении участников валютного рынка. Это дает возможность при построении модели исходить из самого ряда, не привлекая дополнительной информации, а все рассуждения о массовом поведении участников рынка использовать лишь для качественной интерпретации. Если бы удалось найти в динамике ряда хотя бы краткосрочные закономерности, реализующиеся с вероятностью более 50%, то это дало бы основания рассчитывать на успех. Тогда стало бы возможным применение статистических методов для прогнозирования курсов, улавливающих более или менее устойчивые отношения последовательных событий временного ряда .

В данном случае ставится следующая задача. Во-первых, выяснить применимость для краткосрочного прогнозирования валютных курсов каких-либо статистических методов, назначение которых – описывать повторяющиеся события или ситуации, характеризующиеся относительно устойчивыми связями. Во-вторых, если статистические методы применимы для решения поставленной задачи, то установить их наиболее перспективный класс, указать характерные особенности этих методов, особое внимание уделить простейшим из них. В-третьих, показать на примере практические результаты. Отметим, что вопросам прогнозирования курсов валют всегда уделялось большое внимание. Из публикаций на близкую тему укажем, например, работу К. Гренжера и О. Моргенштерна (Granger Clive W.J., Morgenstern Oscar. Predictability of stock market prices. Massachusetts, 1970), в которой исследуется динамика курсов акций и приведена обширная библиография. В этой монографии фактически сделан вывод о том, что если и есть какая-либо в рядах подобного рода, то наиболее вероятно, что она имеется между смежными приростами курсов. Однако возникает вопрос, не пытаемся ли мы прогнозировать совершенно случайные колебания курсов валют. Ответ на этот вопрос находится в специальном исследовании .

Современное прогнозирование

Новый взгляд на роль прогнозирования утвердился как обязательный элемент процесса принятия решения. Логическим следствием усиления роли прогнозирования явилось повышение требований к обоснованности и надежности прогнозных оценок. Однако уровень соответствия аппарата современной прогностики этим новым требованиям остается чрезмерно низким. Даже применение адаптивных моделей, с помощью которых удается, как правило, достичь необходимого уровня адекватности в описании прогнозируемых процессов, только частично решает проблему повышения надежности. Современная экономика порождает процессы со столь сложной динамикой, что идентификация ее закономерностей аппаратом современной прогностики часто оказывается неразрешимой задачей. Совершенствование этого аппарата, прежде всего, нуждается в новых идеях и новых подходах, на основе которых возможна реализация механизмов и способов отражения динамики, формируемой под воздействием эффектов, возможность появления которых в будущем не обнаруживается в данных исторического периода. Возникает явное противоречие, преодоление которого будет способствовать формированию нового взгляда на прогнозирование как упреждающее отражение в вероятностной среде представления об исследуемом процессе в виде траектории, построенной на основе объективных тенденций и субъективные ожидания.

В рамках экономического прогнозирования развитие адаптивного подхода происходит по трем направлениям. Первое из них ориентировано, в основном, на усложнения адаптивных прогнозных моделей. Идея второго направления состоит в совершенствовании адаптивного механизма моделей прогнозирования. В третьем направлении реализуется подход совместного использования адаптивных принципов и других методов прогнозирования, в частности, имитационного моделирования. Разработке адаптивно-имитационных моделей посвящены труды В.В. Давниса .

Развитие рынка определяется , но также верно и обратное – фундаментальные факторы определяются рынком , т.е. поведением участников рынка, их оценками и ожиданиями. При этом умение давать правильную оценку развитию рыночных ситуаций зависит от способности предвосхищать превалирующие ожидания участников рынка, а не от способности прогнозировать изменения в реальном мире . Поэтому идеи развития математического аппарата прогнозирования не в достаточной степени учитывают свойства активности экономических систем, что снижает даже при высокой интерполяционной точности уровень правдоподобности прогнозных оценок. В то же время прогнозы, основанные только на субъективной информации, ориентированы на предсказание качественных характеристик, и поэтому их использование возможно только в специальных случаях. Это выводит на первый план проблему построения прогнозов на основе комбинирования экстраполяционных и субъективных оценок. Проводились исследования в данной области, однако анализ результатов этих исследований показал преобладание в них творческого характера, что свидетельствует, по сути, о начальном уровне разработанности проблемы построения комбинированных прогнозов.

Литература

1. Соболев В.В. Валютный дилинг на финансовых рынках/ Юж.-Рос. гос. техн. ун-т (НПИ). – Новочеркасск, 2009. – 442 с.
2. Лукашин Ю. П. Адаптивные методы краткосрочного прогнозирования временных рядов: Учеб. пособие. – М.: Финансы и статистика, 2003. – 416 с.
3. Давнис В.В., Тинякова В.И. Адаптивные модели: анализ и прогноз в экономических системах. – Воронеж: Изд-во Воронеж. гос. ун-та, 2006.– 380 с.
4. Мишкин Ф. Экономическая теория денег, банковского дела и финансовых рынков: Учебное пособие для вузов/ Пер. с англ. Д.В. Виноградова под ред. М.Е. Дорошенко. – М.: Аспект Пресс, 1999. – 820 с.
5. Лукашин Ю.П. О возможности краткосрочного прогнозирования курсов валют с помощью простейших статистических моделей // Вестник МГУ. -1990. — Сер. 6. Экономика. -№ 1.-С. 75-84.
6. Соболев В.В. Финансисты/ Юж.-Рос. гос. техн. ун-т (НПИ).–Новочеркасск, 2009.–315 с.
7. Сорос Дж. Алхимия финансов: Пер.с англ. – М.: “Инфра-М”, 1996. – 416 с.

Fortrader

Suite 11, Second Floor, Sound & Vision House, Francis Rachel Str. Victoria Victoria, Mahe, Seychelles +7 10 248 2640568

ВВЕДЕНИЕ

В переводе с греческого слово «прогноз» означает предвидение, предсказание о развитии чего-либо, основанное на определенных фактических данных. В общем виде под прогнозом следует понимать научно обоснованное суждение о возможных состояниях объекта в будущем, об альтернативных путях и сроках его осуществления.

Цель прогнозирования состоит в создании научных предпосылок, включающих научный анализ тенденций развития экономики; вариантное предвидение предстоящего развития общественного воспроизводства, учитывающее как сложившиеся тенденции, так и намеченные цели; оценку возможных последствий принимаемых решений; обоснование направлений социально-экономического и научно-технического развития для принятия управляющих решений.

Прогнозы природных ресурсов характеризуют вовлечение последних в хозяйственный оборот и охватывают все виды общественного воспроизводства и природную среду: топливо и минеральные ресурсы, ресурсы Мирового океана, некоторые виды энергии, растительный и животный мир, а также охрану окружающей среды.

МАТЕМАТИЧЕСКИЕ МЕТОДЫ ПРОГНОЗИРОВАНИЯ

Математические методы прогнозирования имеют высокую достоверность получаемой информации. При прогнозировании наибольшее распространение получили методы математической экстраполяции, экономико-статистического и экономико-математического моделирования.

Методы математической экстраполяции позволяют количественно охарактеризовать прогнозируемые процессы. Он основан на изучении сложившихся в прошлом закономерностей развития изучаемого явления и распространения их на будущее. Метод исходит из того, что в экономической жизни действует принцип инерции, т.е. наблюдаемые закономерности достаточно устойчивы в течение некоторого периода времени.

Экстраполяция в прогнозировании осуществляется с помощью выравнивания статистических рядов вне их связи с другими рядами экономической динамики, влияние которых учитывается в усредненном виде лишь на основе опыта прошлого.

Предпосылка о сохранении неизменности условий предшествующего периода при экстраполяции ограничивает возможности применения этого метода сравнительно непродолжительными периодами, в течение которых не происходит существенных качественных изменений. Наиболее достоверны результаты прогнозирования при соотношении продолжительности предшествующего периода (ретроспекции) и периода упреждения (проспекции).

Для применения данного метода необходимо иметь продолжительный ряд показателей за прошедшей период. Данная информация изучается и обрабатывается. Фактический временной ряд выравнивается путем графоаналитического или статистического подбора аппроксимирующей функции. Далее разрабатывают гипотезы изменения объекта в прогнозный период (период упреждения) и формализуют их в виде количественных показателей (тенденций). При этом значения показателей можно прогнозировать не только на конец прогнозного срока, но и на промежуточных этапах.

Методы и приемы математической статистики, теории вероятности дают возможность использовать широкий круг функций для прогнозирования необходимого показателя во времени.

Данные методы имеют недостатки, так как не может быть дан достоверный прогноз на длительный срок, если имеются скачкообразные изменения данных; нет возможности определить качественные характеристики прогнозируемых объектов.

Методы математической экстраполяции применяются при прогнозировании отводов земель для несельскохозяйственных нужд, установления урожайности сельскохозяйственных культур и т.д.

Наиболее часто применяются при прогнозировании экономико-статистические модели. На основе их рассчитывают урожайность сельскохозяйственных культур, продуктивность животных, выход продукции с сельскохозяйственных земель, прогнозные нормативы (облесенность территории, сельскохозяйственная освоенность земель и др.). Данный метод позволяет научно обосновать показатели и нормативы, используемые при планировании.

Экономико-статистической моделью называют функцию, связывающую результативный и факторные показатели, выраженную в аналитическом, графическом, табличном или ином виде, построенную на основе массовых данных и обладающую статистической достоверностью. Такие функции называют производственными, так как они описывают зависимость результатов производства от имеющихся факторов.

Процесс разработки экономико-статистической модели (моделирование) состоит из следующих стадий:

1. Экономический анализ производства. Определение зависимой переменной (результативный показатель) и выявление факторов, влияющих на неё (факторный показатель).
2. Сбор статистических данных и их обработка.
3. Установление математической формы связи (вид уравнения) между результативными и факториальными показателями.
4. Определение числовых параметров экономико-статистической модели.
5. Оценка степени соответствия экономико-статистической модели изучаемому процессу.
6. Экономическая интерпретация модели.

Экономический анализ производства заключается в определении цели, задачи и выборе результативного показателя, который отражает эффективность прогнозного решения. При анализе интенсивности использования земель в сельскохозяйственных организациях в качестве результативного показателя могут быть использованы стоимость валовой продукции в расчёте на 100 га сельхозземель (пахотных земель), урожайность культур, продуктивность земель и др.

В качестве факторных показателей используют балл плодородия почв, сельскохозяйственную освоенность и распаханность, энерговооруженность, трудообеспеченность и т. д.

При выборе независимых факторов руководствуются определенными правилами:

1. Точность производственных функций выше при большем числе эмпирических данных (при крупных выборках).
2. Факторы-аргументы должны оказывать наиболее существенное влияние на изучаемый процесс, количественно измеряться и представляться лишь одним признаком.
3. Количество отобранных факторов не должно быть большим, так как это усложняет модель и повышает трудоёмкость её использования.
4. Включаемые в модель факторы не должны находиться между собой в состоянии функциональной связи (автокорреляция), так как они характеризуют одну и ту же сторону изучаемого явления и дублируют друг друга. При использовании их в экономико-статистической модели изучаемые зависимости и результаты расчётов могут быть искажены.

Сбор статистических данных и их обработку производят после определения зависимой переменной (результативного показателя) и факторов-аргументов. При сборе информации используют экспериментальный и статистический методы. Первый предполагает изучение данных, получаемых в результате проведения опытов, условия которых можно контролировать. Но в землеустройстве процесс экспериментирования затруднён, а при решении отдельных вопросов вообще невозможен.

Второй метод основан на использовании статистических данных (сплошных или выборочных). Например, если при анализе размеров землепользования используются данные по всем сельскохозяйственным предприятиям области, то статистическая информация является сплошной, а изучаемая совокупность - генеральной.

Однако размер генеральных совокупностей бывает слишком большим - несколько сотен единиц и более. Поэтому для сокращения расчётов и экономии времени число наблюдений сокращают, получая выборочные данные (формируя выборочную совокупность) различными методами, позволяющими сохранить достоверность вычислений и распространить результаты исследований на генеральную совокупность.

Во всех случаях выборка должна быть однородной; исключать аномальные объекты и данные (сильно отличающиеся от всех остальных); включать только факторы, которые измеряются однозначно некоторым числом или системой чисел.

Определение математической формы связи переменных производят, логически анализируя процесс. Анализ позволяет установить вид уравнения (линейное, нелинейное), форму связи (парная или множественная) и т. д.

Определение параметров модели включает расчёт числовых характеристик математической зависимости (уравнения). Например, если для установления зависимости урожайности сельскохозяйственных культур (у) от балла плодородия ночв (х) выбрана линейная зависимость вида, то данная стадия моделирования заключается в получении численных значений коэффициентов и.

Для определения параметров уравнения могут применяться различные методы, но практика показывает, что самые точные результаты даёт метод наименьших квадратов. Оценка степени соответствия экономико-статистической модели изучаемому процессу осуществляется с использованием специальных коэффициентов (корреляции, детерминации, существенности и др.). Данные коэффициенты показывают соответствие математического выражения изучаемому процессу, можно ли использовать полученную модель для проведения последующих расчётов и принятия землеустроительных решений, насколько точно определяется результативный показатель и с какой вероятностью можно доверять ему.

Экономическое применение модель находит при научном обосновании нормативов, экономическом обосновании показателей в прогнозных разработках. математический экстраполяция сельскохозяйственный

Наиболее распространённым видом экономическо-статистических моделей являются производственные функции.

Производственная функция - это математически выраженная зависимость результатов производства от производственных факторов.

С помощью производственных функций при прогнозировании анализируют состояние и использование земель; подготавливают исходную информацию для экономико-математических задач по оптимизации различных решений; устанавливают уровень результативного признака на перспективу при планировании и прогнозировании использования земель в схемах и проектах землеустройства; определяют экономические оптимумы, коэффициенты эластичности, эффективности и взаимозаменяемости факторов. Для выражения зависимостей при прогнозировании наиболее часто употребляется линейная зависимость, поскольку она проста в применении. Реже применяются степенные, гиперболические, полиномиальные и другие.

Экономико-математическое моделирование предполагает создание модели, которая изучает экономический объект и представляет его описание с помощью знаков и символов (математических уравнений и неравенств, матриц, формул и др.).

Решение любой экономико-математической задачи при планировании и прогнозировании в землеустройстве связано с большим количеством информации. Для моделирования необходимо получить исходную информацию, ее обработать, проанализировать и оценить. Собранная информация должна быть полной, достоверной, своевременной, оперативной, представляться в удобной форме для дальнейшего использования. При этом затраты на сбор, обработку, передачу, хранение информации. При планировании и прогнозировании в землеустройстве используют следующие виды и источники информации: геоинформационные данные, статистические и отчетные данные по объекту планирования, плановая информация, нормативная информация.

Основой экономико-математической модели является матрица - специальная таблица, содержащая смысловые или кодовые обозначения функции цели; переменных и ограничений; их числовое выражение в виде коэффициентов или ограничений;

Целевая функция это аналитическая форма выражения критерия оптимальности. При моделировании в зависимости от уровня объекта (процесса) выделяют глобальный, отраслевой, локальный и частные критерии оптимальности;

Размер матрицы определяется перечнем переменных величин. В качестве переменных величин используют площади земель; показатели производственной деятельности сельскохозяйственной отрасли (по растениеводству, животноводству в целом; по сельскохозяйственным культурам; по видам скота).

Нахождение при прогнозировании оптимальных решений зависит от правильного определения состава ограничений. Ограничения формулируют в виде системы неравенств и уравнений, выражающей возможности производства и баланс ресурсов.

Ограничения могут быть основными, которые накладываются на все или большинство переменных (площади земель, рабочих участков, дозы внесения удобрений и т. д.), дополнительными - накладываются на отдельные переменные или небольшие группы (объёмы производства отдельных видов продукции, потребление некоторыми группами животных некоторых видов кормов и т. д.) и вспомогательными (не имеют самостоятельного экономического значения, используются для правильной формулировки экономических требований и математической записи).

Используют различные виды экономико-математических моделей: корреляционные модели и производственные функции, балансовые модели, модели оптимизации. При разработке схемы землеустройства административного района решаются следующие основные экономико-математические задачи: распределение земель административного района по категориям; оптимизация мероприятий по освоению и интенсификации использования земель; оптимизация размещения, специализации и уровня концентрации сельскохозяйственного производства в административном районе; установление оптимальных размеров сельскохозяйственных организаций; перераспределения земель между сельскохозяйственными организациями и др. Данные задачи часто состоят из блоков, каждый из которых имеет свой критерий оптимальности.

Например: в основу модели по оптимизации размещения, специализации и уровня концентрации сельскохозяйственного производства в административном районе положены две модели: по определению оптимального сочетания отраслей сельскохозяйственного производства и по установлению оптимального размера землепользований сельскохозяйственных организаций.

Данная задача состоит из блоков, в качестве которых выступают сельскохозяйственные организации.

В качестве переменных используют неизвестные: посевные площади сельскохозяйственных культур; виды и подвиды земель; трансформируемые земли; виды внутрихозяйственных ресурсов и другие переменные, которые учитывают особенности района.

Выделяют следующие группы ограничений:

1. Условия использование земель (по площадям, по качественным условиям) и возможность их трансформации.
2. Соотношение площадей земель.
3. Агробиологические и зоотехнические условия ведения сельскохозяйственного производства.
4. Ограничения по производству и использованию кормов.
5. Рекомендуемый размер землепользований сельскохозяйственных организаций в зависимости от специализации.
6. Ресурсные ограничения (по объему продаж продукции, по затратам труда, по денежным затратам на тех. средства, мин. удобрения, семена и др.).
7. Ограничения, учитывающие особенности расселения, а также использование трудовых и механизированных ресурсов.
8. Общерайонные условия и пропорции (баланс распределения материально-технических фондов по району, численность занятых в сельском хозяйстве и всего населения по району и др.).

В качестве критерия оптимальности при решении данной задачи используют, как правило, минимум приведенных затрат на фиксированный объем производства продукции.

В результате решения задачи устанавливают: состав и соотношение земель по отдельным землепользованиям и в целом по району; площади земель, подлежащие улучшению, освоению и трансформации; посевные площади сельскохозяйственных культур; структуру стада животных, производства и потребления кормов; межхозяйственное и внутрихозяйственное размещение отраслей в районе; специализацию и объем производства продукции в сельскохозяйственных организаций и их объединениях; балансы средств в целом по району и в разрезе сельхозорганизаций; распределение единовременных средств между сельхозорганизациями.

Приложение 1. МЕТОДЫ СТАТИСТИЧЕСКОГО АНАЛИЗА И ПРОГНОЗИРОВАНИЯ В БИЗНЕСЕ

4. Математический инструментарий прогнозирования

Математические методы и модели, используемые в задачах стохастического анализа и прогнозирования в бизнесе, могут относиться к самым различным разделам математики: к регрессионному анализу, анализу временных рядов, формированию и оцениванию экспертных мнений, имитационному моделированию, системам одновременных уравнений, дискриминантному анализу, логит- и пробит-моделям, аппарату логических решающих функций, дисперсионному или ковариационному анализу, анализу ранговых корреляций и таблиц сопряженности и т. д. Однако все они объединены тем, что представляют собой различные подходы к решению центральной проблемы многомерного статистического анализа и эконометрики – проблемы статистического исследования зависимостей , которая, как раз, и является базовой проблемой статистического анализа и прогнозирования в бизнесе (ее общая формулировка была приведена в п. 2).

В п. 1 уже было замечено, что среди p + k + l + m компонент анализируемого многомерного признака могут быть как количественные, так и ординальные и номинальные переменные. Упомянутые выше подходы к решению центральной проблемы многомерного статистического анализа формировались именно с учетом природы исследуемых переменных. Соответствующая специализация этих подходов отражена в табл. 4. В ней же даны ссылки на литературные источники, в которых можно найти достаточно полное описание этих подходов.

Таблица 4.

Природа результирующих показателей	Природа объясняющих переменных	Название обслуживающих разделов многомерного статистического анализа	Литературные источники

Количественная	Количественная	Регрессионный анализ и системы одновременных уравнений
Количественная	Единственная количественная переменная, интерпретируемая как «время»	Анализ временных рядов
Количественная	Неколичественная (ординальные или номинальные переменные)	Дисперсионный анализ
Количественная		Ковариационный анализ, модели типологической регрессии
Неколичественная (ординальные переменные)	Неколичественная (ординальные и номинальные переменные)	Анализ ранговых корреляций и таблиц сопряженности
Неколичественная (номинальные переменные)	Количественная	Дискриминантный анализ, логит- и пробит-модели, кластер-анализ, таксономия, расщепление смесей распределений
Смешанная (количественные и неколичественные переменные)	Смешанная (количественные и неколичественные переменные)	Аппарат логических решающих функций, Data Mining

Тем не менее, практика статистического анализа и прогнозирования в бизнесе свидетельствует о том, что во всем спектре их математического инструментария бесспорное лидерство (по распространенности и актуальности) принадлежит трем разделам:
- регрессионному анализу;
- анализу временных рядов;
- механизму формирования и статистического анализа экспертных оценок.

Кратко остановимся на каждом из этих разделов.

Регрессионный анализ

Как и прежде, будем описывать функционирование исследуемого реального объекта (фирмы, компании, процесса производства или дистрибуции продукции и т. п.) набором переменных и (их содержательный смысл описан в п. 2). Введем ряд определений и понятий, используемых в регрессионном анализе.

Результирующие (зависимые, эндогенные) переменные. Переменная , характеризующая результат или эффективность функционирования анализируемой системы, называется результирующей (зависимой, эндогенной). Ее значения формируются в процессе и внутри функционирования этой системы под воздействием ряда других переменных и факторов, часть из которых поддается регистрации и, в определенной степени, управлению и планированию (эту часть принято называть объясняющими переменными, см. ниже). В регрессионном анализе результирующая переменная выступает в роли функции, значения которой определяются (правда, с некоторой случайной погрешностью) значениями упомянутых выше объясняющих переменных, выступающих в роли аргументов. Поэтому по природе своей результирующая переменная всегда стохастична (случайна). В общем случае обычно анализируется поведение сразу нескольких результирующих переменных .

Объясняющие (предикторные, экзогенные) переменные . Переменные (или признаки), поддающиеся регистрации, описывающие условия функционирования изучаемой реальной экономической системы и в существенной мере определяющие процесс формирования значений результирующих переменных, называются объясняющими. Как правило, часть из них поддается хотя бы частичному регулированию и управлению. Значения ряда объясняющих переменных могут задаваться как бы «извне» анализируемой системы. В этом случае их принято называть экзогенными. В регрессионном анализе они играют роль аргументов той функции, в качестве которой рассматривается анализируемый результирующий показатель . По своей природе объясняющие переменные могут быть как случайными, так и неслучайными.

Регрессионные остатки – это латентные (т. е. скрытые, не поддающиеся непосредственному измерению) случайные компоненты, отражающие влияние соответственно на не учтенных в составе факторов, а также случайные ошибки в измерении анализируемых результирующих переменных. Они, вообще говоря, тоже могут зависеть от , т. е. в общем случае .

Общая схема взаимодействия переменных в регрессионном анализе изображена на рисунке.

Рисунок . Общая схема взаимодействия переменных в регрессионном анализе.

Функция регрессии по . Функция называется функцией регрессии по (или просто – регрессией по ), если она описывает изменение условного среднего значения результирующей переменной (при условии, что значения объясняющих переменных зафиксированы на уровнях ) в зависимости от изменения значений объясняющих переменных. Соответственно математически это определение может быть записано в виде

где символ означает операцию теоретического усреднения значений (т. е. – это математическое ожидание случайной величины , а , или просто – это условное математическое ожидание случайной величины , вычисленное при условии, что значения объясняющих переменных зафиксированы на уровне ).

Если мы анализируем одновременно результирующих переменных , то следует рассмотреть соответственно функций регрессий или, что то же, одну векторнозначную функцию

. (11)

Тогда модель регрессии по может быть записана в виде

, (12)

причем, из определения следует, что всегда]

(12’)

(тождественный знак равенства в (12’) означает, что оно справедливо при любых значениях ; вектор-столбец из нулей в правой части имеет размерность ).

задача регрессионного анализа в самом общем виде может быть сформулирована следующим образом:

по результатам измерений

исследуемых переменных на объектах (системах, процессах) анализируемой совокупности построить такую (векторнозначную) функцию (11), которая позволила бы наилучшим (в определенном смысле) образом восстанавливать значения результирующих (прогнозируемых) переменных по заданным значениям объясняющих (экзогенных) переменных .

З а м е ч а н и е 1. Наиболее распространенными являются линейные модели регрессии, т. е. модели, в которых функции регрессии имеют линейный вид:

З а м е ч а н и е 2. Существует по меньшей мере два варианта интерпретации введенных в п. 2 «поведенческих», «статусных» и «внешних» переменных, соответственно, и в рамках описанной модели регрессии (12)–(12’). В первом варианте все три типа переменных и относят к объясняющим переменным и строят регрессию по . В другом варианте переменные и интерпретируют как условия проведения наблюдений и тогда отдельно для каждого фиксированного сочетания этих условий строят регрессионную модель вида (12) (в рамках линейной модели (12 ’’) это будет означать, что сами коэффициенты регрессии зависят от и , т. е. определяются как функции от и ).

Анализ временных рядов

Всякий статистический анализ и прогноз основывается на исходных статистических данных. Их основные типы были представлены в п. 1. При этом, если процесс регистрации данных происходит во времени , и само время фиксируется наряду со значениями анализируемых характеристик , то говорят о статистическом анализе так называемых панельных данных . Если зафиксировать номер переменной и номер статистически обследуемого объекта , то расположенную в хронологическом порядке последовательность значений

называют одномерным временным рядом . Если же одновременно рассматривать одномерных временных рядов вида (13), т. е. исследовать закономерности во взаимосвязанном поведении временных рядов (13) для , характеризующих динамику переменных, измеренных на каком-то одном ( -м) объекте , то тогда говорят о статистическом анализе многомерного временного ряда . По существу, все задачи, связанные с анализом экономической динамики и прогнозом, предусматривают использование в качестве своей статистической базы временных рядов тех или иных показателей.

Как правило, в задачах бизнес-прогнозирования рассматриваются лишь дискретные (по времени наблюдения ) одномерные временные ряды для равноотстоящих моментов наблюдения , т. е. где – заданный временной такт (минута, час, сутки, неделя, месяц, квартал, год и т. п.). В этих случаях исследуемый временной ряд нам будет удобнее представлять в виде

где – значение анализируемого показателя, зарегистрированное в -м такте времени .

Говоря об использовании аппарата анализа временных рядов в проблеме прогнозирования, мы имеем в виду кратко - и среднесрочный прогноз , поскольку построение долгосрочного прогноза подразумевает обязательное использование методов организации и статистического анализа специальных экспертных оценок .

Генезис наблюдений, образующих временной ряд . Речь идет о структуре и классификации основных факторов, под воздействием которых формируются значения элементов временного ряда. Целесообразно выделить следующие 4 типа таких факторов.

(А) Долговременные , формирующие общую (в длительной перспективе) тенденцию в изменении анализируемого признака . Обычно эта тенденция описывается с помощью той или иной неслучайной функции f тр (t), как правило, монотонной. Эту функцию называют функцией тренда или просто трендом .

(Б) Сезонные , формирующие периодически повторяющиеся в определенное время года колебания анализируемого признака. Условимся обозначать результат действия сезонных факторов с помощью неслучайной функции . Поскольку эта функция должна быть периодической (с периодами, кратными сезонам, т. е. кварталам), в ее аналитическом выражении участвуют гармоники (тригонометрические функции), периодичность которых, как правило, обусловлена содержательной сущностью задачи.

(В) Циклические (конъюнктурные ), формирующие изменения анализируемого признака, обусловленные действием долговременных циклов экономической, демографической или астрофизической природы (волны Кондратьева, демографические «ямы», циклы солнечной активности и т. п.). Результат действия циклических факторов будем обозначать с помощью неслучайной функции .

(Г) Случайные (нерегулярные), не поддающиеся учету и регистрации. Их воздействие на формирование значений временного ряда как раз и обусловливает стохастическую природу элементов , а следовательно, и необходимость интерпретации как наблюдений, произведенных над случайными величинами соответственно . Будем обозначать результат воздействия случайных факторов с помощью случайных величин («остатков», «ошибок») . Конечно, вовсе не обязательно, чтобы в процессе формирования значений всякого временного ряда участвовали одновременно факторы всех четырех типов. В одних случаях значения временного ряда могут формироваться под воздействием факторов (А), (Б) и (Г), в других – под воздействием факторов (А), (В) и (Г) и, наконец, – исключительно под воздействием одних только случайных факторов (Г). Однако во всех случаях предполагается непременное участие случайных (эволюционных ) факторов (Г). Кроме того, как правило, принимается (в качестве гипотезы) аддитивная структурная схема влияния факторов (А), (Б), (В) и (Г) на формирование значений , которая означает правомерность представления значений членов временного ряда в виде разложения:

Выводы о том, участвуют или нет факторы данного типа в формировании значений , могут базироваться как на анализе содержательной сущности задачи (т. е. быть априорно-экспертными по своей природе ), так и на специальном статистическом анализе исследуемого временного ряда .

В рамках введенных понятий и обозначений задача статистического анализа временного ряда в общем виде может быть сформулирована следующим образом:

по результатам измерений исследуемой переменной за тактов времени базового периода построить наилучшие (в определенном смысле) оценки для членов разложения (14).

Решение этой задачи используется для построения прогнозного значения на тактов времени вперед с помощью формулы (14) при и при подстановке в нее полученных оценок компонентов правой части разложения.

Механизмы формирования и статистический анализ экспертных оценок

Обычно выделяются следующие основные типы организации работы группы экспертов ():

· коллегиальный : «метод комиссий» (в виде открытой дискуссии по обсуждаемой проблеме); «метод суда» (в виде противостояния «защиты» и «обвинения» по каждому из вариантов обсуждаемого решения проблемы); «мозговая атака» и т.п.;

· частично коллегиальный: сценарный анализ типа «что – если», метод «Делфи» – многотуровое обсуждение проблемы с тайным голосованием экспертов или заполнением специальных анонимных анкет в конце каждого тура и работой независимой аналитической группы в промежутках между турами и т.п.;

· индивидуально-автономный: каждый из участников экспертной группы формирует и высказывает свое мнение (независимо от позиций других участников) в виде ранжирования обсуждаемых вариантов решения (или объектов), их парных сравнений или отнесения каждого из них к одной из заранее описанных градаций (см. формы представления исходных статистических данных в виде таблиц частот или таблиц сопряженности в между мнениями -го и -го экспертов измеряют величиной , где – коэффициент ранговой корреляции Спирмена (см. , гл. 11]). Определив тот или иной способ вычисления «расстояния» между мнениями пары экспертов, мы можем решать затем задачу «кластеризации» экспертов, интерпретируя каждый из найденных таким образом кластер как группу экспертов-единомышленников.

(ii) Анализ взаимной согласованности мнений группы экспертов. Располагая мнениями целой группы экспертов, аналитик-статистик стремится оценить степень согласованности всех этих экспертных оценок, в том числе и статистически проверить гипотезу о полном отсутствии какой-либо их согласованности (и тогда, очевидно, следует либо уточнить постановку предложенной экспертам задачи, либо поменять состав экспертной группы). Эта задача также решается средствами многомерного статистического анализа. Выбор конкретного метода зависит от формы исходных статистических данных. Например, если мнения экспертов представлены ранжировками, то в качестве меры их согласованности можно рассматривать коэффициент объектов), т.е. при исходных статистических данных вида определяется как решение оптимизационной задачи видаj -го эксперта отстоит от единого группового мнения, тем ниже оценивается уровень его относительной компетентности. Заметим, что если в результате исследования структуры совокупности экспертных мнений аналитик-статистик приходит к выводу о наличии нескольких подгрупп экспертов с однородностью мнений внутри каждой подгруппы и с существенным различием мнений в любой паре таких подгрупп, то задача единого группового мнения и оценка относительной компетентности эксперта решается отдельно для каждой из выявленных подгрупп.

Случайные факторы, в свою очередь, могут быть двоякой природы: внезапными («разладочными»), приводящими к скачкообразным структурным изменениям в механизме формирования значений x(t) (что выражается, например, в радикальных скачкообразных изменениях основных структурных характеристик функций f тр (t), j (t) и y (t) анализируемого временного ряда в случайный момент времени), и эволюционными остаточными , обусловливающими относительно небольшие случайные отклонения значений x(t) от тех, которые должны были бы получиться только под воздействием факторов (А), (Б) и (В). Однако в данном разделе будут рассмотрены схемы формирования временных рядов, включающие в себя действие только эволюционных остаточных случайных факторов.

* Данная работа не является научным трудом, не является выпускной квалификационной работой и представляет собой результат обработки, структурирования и форматирования собранной информации, предназначенной для использования в качестве источника материала при самостоятельной подготовки учебных работ.

Matlab- как средство математического моделирования

Рассказывать о программах математического моделирования и возможных областях их применения можно очень долго, но мы ограничимся лишь кратким обзором ведущих программ, укажем их общие черты и различия. В настоящее время практически все современные CAE-программы имеют встроенные функции символьных вычислений. Однако наиболее известными и приспособленными для математических символьных вычислений считаются Maple, MathCad, Mathematica и MatLab. Но, делая обзор основных программ символьной математики, мы укажем и на возможные альтернативы, идеологически схожие с тем или иным пакетом-лидером.

С помощью описываемого ПО можно сэкономить массу времени и избежать многих ошибок при вычислениях. Естественно, CAE системы не ограничиваются только этими возможностями, но в данном обзоре мы сделаем упор именно на них.

Отметим только, что спектр задач, решаемых подобными системами, очень широк:

Проведение математических исследований, требующих вычислений и аналитических выкладок;

Разработка и анализ алгоритмов;

Математическое моделирование и компьютерный эксперимент;

Анализ и обработка данных;

Визуализация, научная и инженерная графика;

Разработка графических и расчетных приложений.

При этом отметим, что поскольку CAE-системы содержат операторы для базовых вычислений, то почти все алгоритмы, отсутствующие в стандартных функциях, можно реализовать посредством написания собственной программы.

Процессор Pentium II или выше;

400-550 Мбайт дискового пространства;

Операционные системы: Windows 98/Me/ NT 4.0/2000/2003 Server/2003x64/XP/XP x64.

Компания Wolfram Reseach, Inc., разработавшая систему компьютерной математики Mathematica, по праву считается старейшим и наиболее солидным игроком в этой области. Пакет Mathematica (текущая версия 5.2) повсеместно применяется при расчетах в современных научных исследованиях и получил широкую известность в научной и образовательной среде. Можно даже сказать, что Mathematica обладает значительной функциональной избыточностью (там, в частности, есть даже возможность для синтеза звука).

Несмотря на свою направленность на серьезные математические вычисления, системы класса Mathematica просты в освоении и могут использоваться довольно широкой категорией пользователей — студентами и преподавателями вузов, инженерами, аспирантами, научными работниками и даже учащимся математических классов общеобразовательных и специальных школ. Все они найдут в подобной системе многочисленные полезные возможности для применения.

При этом широчайшие функции программы не перегружают ее интерфейс и не замедляют вычислений. Mathematica неизменно демонстрирует высокую скорость символьных преобразований и численных расчетов. Программа Mathematica из всех рассматриваемых систем наиболее полна и универсальна, однако у каждой программы есть как свои достоинства, так и недостатки. А главное — у них есть свои приверженцы, которых бесполезно убеждать в превосходстве другой системы. Но те, кто серьезно работает с системами компьютерной математики, должны пользоваться несколькими программами, ибо только это гарантирует высокий уровень надежности сложных вычислений.

Отметим, что в разработках различных версий системы Mathematica, наряду с головной фирмой Wolfram Research, Inc., принимали участие другие фирмы и сотни специалистов высокой квалификации, в том числе математики и программисты. Система Mathematica является одной из самых крупных программных систем и реализует наиболее эффективные алгоритмы вычислений. К их числу, например, относится механизм контекстов, исключающий появление в программах побочных эффектов.

Система Mathematica сегодня рассматривается как мировой лидер среди компьютерных систем символьной математики для ПК, обеспечивающих не только возможности выполнения сложных численных расчетов с выводом их результатов в самом изысканном графическом виде, но и проведение особо трудоемких аналитических преобразований и вычислений. Версии системы под Windows имеют современный пользовательский интерфейс и позволяют готовить документы в форме Notebooks (записных книжек). Они объединяют исходные данные, описания алгоритмов решения задач, программ и результатов решения в самой разнообразной форме (математические формулы, числа, векторы, матрицы, таблицы и графики).

Mathematica была задумана как система, максимально автоматизирующая труд научных работников и математиков-аналитиков, поэтому она заслуживает изучения даже в качестве типичного представителя элитных и высокоинтеллектуальных программных продуктов высшей степени сложности. Однако куда больший интерес она представляет как мощный и гибкий математический инструментарий, который может оказать неоценимую помощь большинству научных работников, преподавателей университетов и вузов, студентов, инженеров и даже школьников.

С самого начала большое внимание уделялось графике, в том числе динамической, и даже возможностям мультимедиа — воспроизведению динамической анимации и синтезу звуков. Набор функций графики и изменяющих их действие опций очень широк. Графика всегда была сильной стороной различных версий системы Mathematica и обеспечивала им лидерство среди систем компьютерной математики.

В результате Mathematica быстро заняла ведущие позиции на рынке символьных математических систем. Особенно привлекательны обширные графические возможности системы и реализация интерфейса типа Notebook. При этом система обеспечивала динамическую связь между ячейками документов в стиле электронных таблиц даже при решении символьных задач, что принципиально и выгодно отличало ее от других подобных систем.

Таким образом, Mathematica — это, с одной стороны, типичная система программирования на базе одного из самых мощных проблемноориентированных языков функционального программирования высокого уровня, предназначенная для решения различных задач (в том числе и математических), а с другой — интерактивная система для решения большинства математических задач в диалоговом режиме без традиционного программирования. Таким образом, Mathematica как система программирования имеет все возможности для разработки и создания практически любых управляющих структур, организации ввода-вывода, работы с системными функциями и обслуживания любых периферийных устройств, а с помощью пакетов расширения (Add-ons) появляется возможность подстраиваться под запросы любого пользователя, (хотя рядовому пользователю эти средства программирования могут и не понадобиться — он вполне обойдется встроенными математическими функциями системы, поражающими своим обилием и многообразием даже опытных математиков).

К недостаткам системы Mathematica следует отнести разве что весьма необычный язык программирования, обращение к которому, впрочем, облегчает подробная система помощи.

Минимальные требования к системе:

Процессор Pentium III 650 МГц;

400 Мбайт дискового пространства;

Операционные системы: Windows NT 4 (SP5)/98/ME/2000/2003 Server/XP Pro/XP Home.

Программа Maple (последняя версия 10.02) — своего рода патриарх в семействе систем символьной математики и до сих пор является одним из лидеров среди универсальных систем символьных вычислений. Она предоставляет пользователю удобную интеллектуальную среду для математических исследований любого уровня и пользуется особой популярностью в научной среде. Отметим, что символьный анализатор программы Maple является наиболее сильной частью этого ПО, поэтому именно он был позаимствован и включен в ряд других CAE-пакетов, таких как MathCad и MatLab, а также в состав пакетов для подготовки научных публикаций Scientific WorkPlace и Math Office for Word.

Пакет Maple — совместная разработка Университета Ватерлоо (шт. Онтарио, Канада) и Высшей технической школы (ETHZ, Цюрих, Швейцария). Для его продажи была создана специальная компания — Waterloo Maple, Inc., которая, к сожалению, больше прославилась математической проработкой своего проекта, чем уровнем его коммерческой реализации. В результате система Maple ранее была доступна преимущественно узкому кругу профессионалов. Сейчас эта компания работает совместно с более преуспевающей в коммерции и в проработке пользовательского интерфейса математических систем фирмой MathSoft, Inc. — создательницей весьма популярных и массовых систем для численных расчетов MathCad, ставших международным стандартом для технических вычислений.

Maple предоставляет удобную среду для компьютерных экспериментов, в ходе которых пробуются различные подходы к задаче, анализируются частные решения, а при необходимости программирования отбираются требующие особой скорости фрагменты. Пакет позволяет создавать интегрированные среды с участием других систем и универсальных языков программирования высокого уровня. Когда расчеты произведены и требуется оформить результаты, то можно использовать средства этого пакета для визуализации данных и подготовки иллюстраций для публикации. Для завершения работы остается подготовить печатный материал (отчет, статью, книгу) прямо в среде Maple, а затем можно приступать к очередному исследованию. Работа проходит интерактивно — пользователь вводит команды и тут же видит на экране результат их выполнения. При этом пакет Maple совсем не похож на традиционную среду программирования, где требуется жесткая формализация всех переменных и действий с ними. Здесь же автоматически обеспечивается выбор подходящих типов переменных и проверяется корректность выполнения операций, так что в общем случае не требуется описания переменных и строгой формализации записи.

Пакет Maple состоит из ядра (процедур, написанных на языке С и хорошо оптимизированных), библиотеки, написанной на Maple-языке, и развитого внешнего интерфейса. Ядро выполняет большинство базовых операций, а библиотека содержит множество команд — процедур, выполняемых в режиме интерпретации.

Интерфейс Maple основан на концепции рабочего поля (worksheet) или документа, содержащего строки ввода-вывода и текст, а также графику.

Работа с пакетом происходит в режиме интерпретатора. В строке ввода пользователь задает команду, нажимает клавишу Enter и получает результат — строку (или строки) вывода либо сообщение об ошибочно введенной команде. Тут же выдается приглашение вводить новую команду и т.д.

Вычисления в Maple

Систему Maple можно использовать и на самом элементарном уровне ее возможностей — как очень мощный калькулятор для вычислений по заданным формулам, но главным ее достоинством является способность выполнять арифметические действия в символьном виде, то есть так, как это делает человек. При работе с дробями и корнями программа не приводит их в процессе вычислений к десятичному виду, а производит необходимые сокращения и преобразования в столбик, что позволяет избежать ошибок при округлении. Для работы с десятичными эквивалентами в системе Maple имеется специальная команда, аппроксимирующая значение выражения в формате чисел с плавающей запятой.

Система Maple предлагает различные способы представления, сокращения и преобразования выражений, например такие операции, как упрощение и разложение на множители алгебраических выражений и приведение их к различному виду. Таким образом, Maple можно использовать для решения уравнений и систем.

Maple также имеет множество мощных инструментальных средств для вычисления выражений с одной или несколькими переменными. Программу можно использовать для решения задач дифференциального и интегрального исчисления, вычисления пределов, разложений в ряды, суммирования рядов, умножения, интегральных преобразований (таких как преобразование Лапласа, Z-преобразование, преобразование Меллина или Фурье), а также для исследования непрерывных или кусочно-непрерывных функций.

Maple может вычислять пределы функций, как конечные, так и стремящиеся к бесконечности, а также распознает неопределенности в пределах. В этой системе можно решать множество обычных дифференциальных уравнений (ODE), а также дифференциальные уравнения в частных производных (PDE), в том числе задачи с начальными условиями (IVP) и задачи с граничными условиями (BVP).

Одним из наиболее часто используемых в системе Maple пакетов программ является пакет линейной алгебры, содержащий мощный набор команд для работы с векторами и матрицами. Maple может находить собственные значения и собственные векторы операторов, вычислять криволинейные координаты, находить матричные нормы и вычислять множество различных типов разложения матриц.

Программирование

Система Maple использует процедурный язык 4-го поколения (4GL). Этот язык специально предназначен для быстрой разработки математических подпрограмм и пользовательских приложений. Синтаксис данного языка аналогичен синтаксису универсальных языков высокого уровня: C, Fortran, Basic и Pascal.

Maple может генерировать код, совместимый с такими языками программирования, как Fortran или C, и с языком набора текста LaTeX, который пользуется большой популярностью в научном мире и применяется для оформления публикаций. Одно из преимуществ этого свойства — способность обеспечивать доступ к специализированным числовым программам, максимально ускоряющим решение сложных задач. Например, используя систему Maple, можно разработать определенную математическую модель, а затем с ее помощью сгенерировать код на языке C, соответствующий этой модели. Язык 4GL, специально оптимизированный для разработки математических приложений, позволяет сократить процесс разработки, а настроить пользовательский интерфейс помогают элементы Maplets или документы Maple со встроенными графическими компонентами.

Одновременно в среде Maple можно подготовить и документацию к приложению, так как средства пакета позволяют создавать технические документы профессионального вида, содержащие текст, интерактивные математические вычисления, графики, рисунки и даже звук. Вы также можете создавать интерактивные документы и презентации, добавляя кнопки, бегунки и другие компоненты, и, наконец, публиковать документы в Интернете и развертывать интерактивные вычисления в Сети, используя сервер MapleNet.

Интернет-совместимость

Maple является первым универсальным математическим пакетом, который предлагает полную поддержку стандарта MathML 2.0, управляющего как внешним видом, так и смыслом математики в Интернете. Эта эксклюзивная функция делает текущую версию MathML основным средством Интернет-математики, а также устанавливает новый уровень совместимости многопользовательской среды. TCP/IP-протокол обеспечивает динамический доступ к информации из других Интернет-ресурсов, например к данным для финансового анализа в реальном времени или к данным о погоде.

Перспективы развития

Последние версии Maple, помимо дополнительных алгоритмов и методов решения математических задач, получили более удобный графический интерфейс, продвинутые инструменты визуализации и построения графиков, а также дополнительные средства программирования (в том числе по совместимости с универсальными языками программирования). Начиная с девятой версии в пакет был добавлен импорт документов из программы Mathematica, а в справочную систему были введены определения математических и инженерных понятий и расширена навигация по страницам справки. Кроме того, было повышено полиграфическое качество формул, особенно при форматировании больших и сложных выражений, а также значительно сокращен размер MW-файлов для хранения рабочих документов Maple.

Таким образом, Maple — это, пожалуй, наиболее удачно сбалансированная система и бесспорный лидер по возможностям символьных вычислений для математики. При этом оригинальный символьный движок сочетается здесь с легко запоминающимся структурным языком программирования, так что Maple может быть использована как для небольших задач, так и для серьезных проектов.

К недостаткам системы Maple можно отнести лишь ее некоторую «задумчивость», причем не всегда обоснованную, а также очень высокую стоимость этой программы (в зависимости от версии и набора библиотек цена ее доходит до нескольких десятков тысяч долл., правда студентам и научным работникам предлагаются дешевые версии — за несколько сотен долл.).

Пакет Maple широко распространен в университетах ведущих научных держав, в исследовательских центрах и компаниях. Программа постоянно развивается, вбирая в себя новые разделы математики, приобретая новые функции и обеспечивая лучшую среду для исследовательской работы. Одно из основных направлений развития этой системы — повышение мощности и достоверности аналитических (символьных) вычислений. Это направление представлено в Maple наиболее широко. Уже сегодня Maple может выполнять сложнейшие аналитические вычисления, которые нередко не по силам даже опытным математикам.

Минимальные требования к системе:

Процессор Pentium III, 4, Xeon, Pentium M; AMD Athlon, Athlon XP, Athlon MP;

400 Мбайт дискового пространства (только для самой системы MatLab и ее Help);

Операционная система Microsoft Windows 2000 (SP3)/XP.

Система MatLab относится к среднему уровню продуктов, предназначенных для символьной математики, но рассчитана на широкое применение в сфере CAE (то есть сильна и в других областях). MatLab — одна из старейших, тщательно проработанных и проверенных временем систем автоматизации математических расчетов, построенная на расширенном представлении и применении матричных операций. Это нашло отражение и в самом названии системы — MATrix LABoratory, то есть матричная лаборатория. Однако синтаксис языка программирования системы продуман настолько тщательно, что данная ориентация почти не ощущается теми пользователями, которых не интересуют непосредственно матричные вычисления.

Несмотря на то что изначально MatLab предназначалась исключительно для вычислений, в процессе эволюции (а сейчас выпущена уже версия 7), в дополнение к прекрасным вычислительным средствам, у фирмы Waterloo Maple по лицензии для MatLab было приобретено ядро символьных преобразований, а также появились библиотеки, которые обеспечивают в MatLab уникальные для математических пакетов функции. Например, широко известная библиотека Simulink, реализуя принцип визуального программирования, позволяет построить логическую схему сложной системы управления из одних только стандартных блоков, не написав при этом ни строчки кода. После конструирования такой схемы можно детально проанализировать ее работу.

В системе MatLab также существуют широкие возможности для программирования. Ее библиотека C Math (компилятор MatLab) является объектной и содержит свыше 300 процедур обработки данных на языке C. Внутри пакета можно использовать как процедуры самой MatLab, так и стандартные процедуры языка C, что делает этот инструмент мощнейшим подспорьем при разработке приложений (используя компилятор C Math, можно встраивать любые процедуры MatLab в готовые приложения).

Библиотека C Math позволяет пользоваться следующими категориями функций:

Операции с матрицами;.

Сравнение матриц;

Решение линейных уравнений;

Разложение операторов и поиск собственных значений;

Нахождение обратной матрицы;

Поиск определителя;

Вычисление матричного экспоненциала;

Элементарная математика;

Функции beta, gamma, erf и эллиптические функции;

Основы статистики и анализа данных;

Поиск корней полиномов;

Фильтрация, свертка;

Быстрое преобразование Фурье (FFT);

Интерполяция;

Операции со строками;

Операции ввода-вывода файлов и т.д.

При этом все библиотеки MatLab отличаются высокой скоростью численных вычислений. Однако матрицы широко применяются не только в таких математических расчетах, как решение задач линейной алгебры и математического моделирования, обсчета статических и динамических систем и объектов. Они являются основой автоматического составления и решения уравнений состояния динамических объектов и систем. Именно универсальность аппарата матричного исчисления значительно повышает интерес к системе MatLab, вобравшей в себя лучшие достижения в области быстрого решения матричных задач. Поэтому MatLab давно уже вышла за рамки специализированной матричной системы, превратившись в одну из наиболее мощных универсальных интегрированных систем компьютерной математики.

Для визуализации моделирования система MatLab имеет библиотеку Image Processing Toolbox, которая обеспечивает широкий спектр функций, поддерживающих визуализацию проводимых вычислений непосредственно из среды MatLab, увеличение и анализ, а также возможность построения алгоритмов обработки изображений. Усовершенствованные методы графической библиотеки в соединении с языком программирования MatLab обеспечивают открытую расширяемую систему, которая может быть использована для создания специальных приложений, пригодных для обработки графики.

Таким образом, программу MatLab можно использовать для восстановления испорченных изображений, шаблонного распознавания объектов на изображениях или же для разработки каких-либо собственных оригинальных алгоритмов обработки изображений. Библиотека Image Processing Tollbox упрощает разработку высокоточных алгоритмов, поскольку каждая из функций, включенных в эту библиотеку, оптимизирована для максимального быстродействия, эффективности и достоверности вычислений. Кроме того, библиотека обеспечивает разработчика многочисленным инструментарием для создания собственных решений и для реализаций сложных приложений обработки графики. А при анализе изображений использование мгновенного доступа к мощным средствам визуализации помогает моментально увидеть эффекты увеличения, восстановления и фильтрации.

Среди других библиотек системы MatLab можно также отметить System Identification Toolbox — набор инструментов для создания математических моделей динамических систем, основанных на наблюдаемых входных/выходных данных. Особенностью этого инструментария является наличие гибкого пользовательского интерфейса, позволяющего организовать данные и модели. Библиотека System Identification Toolbox поддерживает как параметрические, так и непараметрические методы. Интерфейс системы облегчает предварительную обработку данных, работу с итеративным процессом создания моделей для получения оценок и выделения наиболее значимых данных. Быстрое выполнение с минимальными усилиями таких операций, как открытие/сохранение данных, выделение области возможных значений данных, удаление погрешностей, предотвращение ухода данных от характерного для них уровня.

Наборы данных и идентифицируемые модели организуются графически, что позволяет легко вызвать результаты предыдущих анализов в течение процесса идентификации системы и выбрать следующие возможные шаги процесса. Основной пользовательский интерфейс организует данные для показа уже полученного результата. Это облегчает быстрое сравнение по оценкам моделей, позволяет выделять графическими средствами наиболее значимые модели и исследовать их показатели.

А что касается математических вычислений, то MatLab предоставляет доступ к огромному количеству подпрограмм, содержащихся в библиотеке NAG Foundation Library компании Numerical Algorithms Group Ltd (инструментарий имеет сотни функций из различных областей математики, и многие из этих программ были разработаны широко известными в мире специалистами). Это уникальная коллекция реализаций современных численных методов компьютерной математики, созданных за последние три десятка лет. Таким образом, MatLab вобрала и опыт, и правила, и методы математических вычислений, накопленные за тысячи лет развития математики. Одну только прилагаемую к системе обширную документацию вполне можно рассматривать как фундаментальный многотомный электронный справочник по математическому обеспечению.

Из недостатков системы MatLab можно отметить невысокую интегрированность среды (очень много окон, с которыми лучше работать на двух мониторах), не очень внятную справочную систему (а между тем объем фирменной документации достигает почти 5 тыс. страниц, что делает ее трудно обозримой) и специфический редактор кода MatLab-программ. Сегодня система MatLab широко используется в технике, науке и образовании, но все-таки она больше подходит для анализа данных и организации вычислений, нежели для чисто математических выкладок.

Поэтому для проведения аналитических преобразований в MatLab используется ядро символьных преобразований Maple, а из Maple для численных расчетов можно обращаться к MatLab. Ведь недаром символьная математика Maple вошла составной частью в целый ряд современных пакетов, а численный анализ от MatLab и наборы инструментов (Toolboxes) уникальны. Тем не менее математические пакеты Maple и MatLab — это интеллектуальные лидеры в своих классах, это образцы, определяющие развитие компьютерной математики.

Математик Константин Воронцов о применении задач машинного обучения в бизнесе, композициях адаптивных моделей и усовершенствовании качества данных

Десять лет назад одна крупная розничная сеть объявила тендер на решение задачи прогнозирования объемов продаж в своей сети. Задачи прогнозирования решают почти все крупные ретейлы, потому что это им необходимо для планирования закупок. Конкурсные условия ставились следующим образом: нам давались данные за два года - это ежедневные продажи примерно 12 000 товаров в одном из магазинов сети, тендер был закрытым, кроме нас на него позвали еще шесть компаний. Среди них были очень крупные вендоры аналитических решений для ретейла. Мы, конечно, оценивали наши шансы выиграть в этом тендере как небольшие.

Условием ставилось составить прогноз продаж на две недели, которые следовали непосредственно за теми двумя годами, по которым были данные. Организаторы конкурса предложили свой функционал качества, по которому мерилось качество прогнозов. Этот функционал был немного нестандартным. Организаторы решили учесть, что в этом функционале складывается большое количество товаров и нехорошо, когда вы складываете штуки с килограммами, поэтому это была сумма по всем товарам, а в знаменатель им пришлось поставить саму прогнозируемую величину. Это был не очень понятный ход, так обычно не делают. Мы предупредили организаторов конкурса, что функционал немного странный, другие участники конкурса их тоже об этом предупреждали, но тем не менее в этом решении тоже была своя логика, и конкурс состоялся при таких условиях.

Обычно прогноз потребительского спроса - точнее, объемов продаж - делается методами прогнозирования, которые очень давно известны в статистике. В целом они основаны на методе наименьших квадратов, где в функционале есть суммы по товарам, суммы по моментам времени и квадрат разности прогноза алгоритма и реального объема продаж для этого товара в этот день. Так обычно устроен функционал, и во всех стандартных решениях минимизация такого функционала позволяет настраивать алгоритм прогнозирования.

Есть много простых, быстро работающих, тоже давно известных, еще с 1960-х годов, методов, которыми мы начали пользоваться, для того чтобы решить задачу прогнозирования. Это методы экспоненциально скользящего среднего, модели Брауна, Тейла - Вейджа, Хольта - Винтерса и так далее. Некоторые из них учитывают сезонность. Сезонность не надо понимать как зима - лето, а скорее как будни - выходные, то есть недельная сезонность. Многие товары действительно продаются по будням и выходным по-разному. Мы сразу поняли, что наши крупные конкуренты в этом тендере будут использовать стандартные подходы: они будут использовать метод наименьших квадратов, потому что у них есть готовые решения, и довольно трудоемкие вычислительные методы вроде нейронных сетей или же авторегрессии. И мы решили пойти другим путем и использовать простые методы с пониманием того, что у каждого товара много своих особенностей. Есть много моделей, но неизвестно, какая модель для каждого товара будет наилучшей. Более того, мы даже предположили, что товар время от времени переключает свою модель и его сначала, может быть, лучше прогнозировать одной моделью, а потом в какой-то момент другая модель начнет работать лучше. Поэтому мы сделали адаптивную композицию простых адаптивных моделей. В каждый момент времени мы выбираем ту модель, которая в последнее время работала лучше, давала более точные прогнозы, переключаемся на нее, и именно она дает прогнозы. Первое решение, которое было сделано, - пользоваться композицией простых моделей, вместо того чтобы строить что-то более сложное.

Второе решение заключалось в том, что мы осознали, что функционал нестандартен, и, как учили на первом курсе физтеха, мы взяли этот функционал, продифференцировали по параметрам модели, приравняли нулю производные и получили некую систему уравнений, из которой вывели новый метод. В принципе это работа для математика на один вечер, но мы догадывались, что наши конкуренты так поступать не будут, потому что у них есть готовые решения, они в них сильно верят. Как оказалось, мы действительно не прогадали.

Еще одна особенность этой задачи - то, что были большие интервалы неслучайного отсутствия спроса. Представьте себе: товар продается стабильно ежедневно, и вдруг вы видите, что две недели этого товара нет вообще. Это, конечно, связано не с тем, что спрос отсутствует, а с тем, что товар просто не привезли, его не было на полках, не было на складе. Такие интервалы отсутствия спроса мы просто вырезали из обучающих данных, чтобы они не повлияли на результат.

Настал день, когда мы показывали наше решение организаторам конкурса. Мы знали, что перед нами выступал один из наших крупных конкурентов, и, когда организаторы спросили: «А сколько часов вычисляет ваша модель?», мы удивились и сказали: «Вы разве не поняли, что мы только что на моем ноутбуке за одну минуту и восемь секунд не только подсчитали все прогнозы, но и обучили нашу модель на двухлетнем интервале?» Это было, конечно, шоком. В итоге наша модель оказалась не только самой точной, но еще и самой быстрой. Мы показали, что все прогнозы по всей сети можно считать буквально за два часа, ночью, на старом сервере и что даже никакого нового оборудования закупать не надо.

Это не только история успеха, но еще и очень поучительная история: во-первых, не надо бояться применять нестандартные методы, и если задача поставлена нестандартно, то только математик может быстро найти решение - хорошо, когда удается быстро, иногда это не удается, конечно; во-вторых, этот случай придал нам сил выйти на рынок с собственными решениями - не надо бояться того, что на рынке есть сильные конкуренты. Был еще один момент поучительности. Когда я сам занимался отбором моделей для этой задачи, то сначала мы ввели целых тридцать разных моделей, и из них так адаптивно, как я рассказал, каждый день для каждого товара выбиралась оптимальная модель.

В принципе это чревато таким явлением, как переобучение, то есть мы могли хорошо, точно подогнаться под обучающие данные и плохо прогнозировать на новых тестовых данных. Я знал об этом явлении, что явление связано с тем, что модель может быть избыточно сложной, тогда и возникает эффект переобучения. Мне казалось, что выбор из тридцати моделей - это не настолько сложно, здесь не должно быть переобучения. Мое удивление было очень сильным, когда я провел эксперимент, сравнил обучение с контрольным и понял, что переобучение просто огромно и мы теряем десятки процентов точности на этом эффекте. Я только собирался еще и еще вводить новые модели, но этот эксперимент показал, что решение надо, наоборот, упрощать и тридцать моделей - это много. Следующим шоком для меня было, когда оказалось, что оптимальное число моделей - шесть, то есть нельзя было строить более сложное решение, чем из шести моделей.

Тогда чисто теоретически эта задача поставила меня в тупик, а решение удалось найти только тогда, когда я работал над докторской диссертацией и уже серьезно исследовал явление переобучения в рамках комбинаторной теории переобучения. Оказалось, что если вы выбираете из моделей и у вас есть одна модель хорошая, а все остальные - плохие, то вы эту хорошую модель, как правило, и будете выбирать. Вы не будете переобучаться, вы будете иметь это одно хорошее решение. Если у вас есть много моделей, но они похожи друг на друга, вы тоже не будете переобучаться, потому что эффективная сложность совокупности таких похожих друг на друга моделей невелика, переобучение тоже низкое. А если получится так, что ваши модели существенно различны и примерно все при этом одинаково плохие, то переобучение может быть очень велико, и эффект переобучения чудовищно растет по мере роста числа моделей. Это была ровно та ситуация, с которой мы столкнулись в этом тендере. А вот объяснить ее теоретически удалось лишь несколько лет спустя.

Была еще одна поучительная история. Тогда же, на этом тендере, презентуя свое решение организаторам конкурса, мы объяснили: «Мы считаем, что ваш функционал неправильно устроен, так делать нельзя. То, что прогнозируемая величина в знаменателе, - это, конечно, нехорошо. То, что ваш функционал выражает квадрат разности ошибок…» Что такое квадрат рублей, например? Это не имеет экономического смысла. Мы предложили оптимизировать функционалы, выражающие потери компании от неточности прогнозов, и показали, как такой функционал должен быть устроен, и показали, что мы готовы оптимизировать такие нестандартные функционалы, тем самым повышать прибыль компании - ровно то, что было нужно для бизнеса. Когда мы начали уже реально работать над проектом, то оказалось, что у компании те самые данные, которые нужны для построения такого функционала, очень грязные. Для части товаров такие данные вообще отсутствовали, для части товаров эти данные были неточны, потому что менеджеры до сих пор не были заинтересованы в том, чтобы такие данные проверялись, контролировались. Это же не бухгалтерия, это какая-то вспомогательная информация. Может быть, она кому-то когда-то понадобится, может быть, нет.

В результате оказалось, что данные грязные, и нужно было усовершенствовать бизнес-процессы и работать над улучшением качества данных. Это то, что бизнес не понимал в тот момент. Когда мы пришли со своим решением и осознали, что борьба за качество и чистоту данных - важная часть бизнеса, мы еще помогли нашим партнерам это осознать и кое-что улучшить внутри бизнес-процессов. Такая поучительная история о связи бизнеса и науки, о том, что наука может дать бизнесу нестандартные решения. Иногда это совсем несложно, но и, наоборот, в процессе поиска этих решений на основе реальных кейсов мы можем получить обратную связь для науки, мы можем столкнуться с какими-то неразрешенными теоретическими вопросами и двинуть теорию вперед.

доктор физико-математических наук, профессор факультета компьютерных наук НИУ ВШЭ