Образовательные программы

Статистика и наука о данных в Нархозе

Описание образовательной программы 6B05401 Статистика и наука о данных в Нархозе

Цель образовательной программы состоит в формировании высококвалифицированных специалистов, которые обладают навыками практической работы с данными. Они должны быть способны проводить сбор, обработку, анализ и визуализацию обширной статистической информации. Такие специалисты должны быть готовы к прогнозированию и принятию управленческих решений как на уровне отдельных предприятий и организаций, так и на макро-уровне.

Языки обучения: русский, казахский, английский.
Срок обучения: 4 года.

Общеобразовательная программа

  • Лидерство и инновации. Данный курс охватывает основные теории лидерства и инноваций и способствует развитию глобальных навыков, которые ищут работодатели. Курс также ознакомит с новейшими инструментами для стимулирования инноваций в организации, в том числе с методами проведения исследований и применением исследований для выработки инноваций. Мероприятия (такие как мозговой штурм, командные задания и др.) обеспечат контекст для проведения и представления мини-исследовательского проекта, чтобы предложить способ решения инновационной задачи и способы использования лидерских навыков для ее воплощения в жизнь.

Вузовские компоненты — перечень базовых учебных дисциплин для освоения образовательной программы.

  1. Алгоритмы и структуры данных. Курс охватывает анализ и проектирование структур данных в качестве инструментов для алгоритмического проектирования эффективных компьютерных программ. Предмет сосредоточен на основных темах структур данных, включая списки на основе массивов, связанные списки, пропуски, хэш-таблицы, рекурсию, бинарные деревья, scapegoat-деревья (самобалансирующееся деревья бинарного поиска), красно-черные деревья, кучи, алгоритмы сортировки и графы.
  2. Анализ временных рядов и прогнозирование. Курс содержит классические методы анализа эконометрических данных. В рамках дисциплины студенты изучат понятия автокорреляции, стационарности в широком и узком смыслах, короткой и долгой памяти, линейные стохастические модели (авторегрессионные модели AR, модели скользящего среднего MA), нелинейные стохастические условно-гауссовские модели (семейство ARCH и модели стохастической волатильности). В рамках индивидуального /командного проекта студенты создадут наиболее подходящую модель описания временных данных на реальных примерах.
  3. Аналитика больших данных. Курс включает методы сбора, анализа и статистического описания данных. Рассматриваются различные технологии для анализа больших данных и визуализации. Целью изучения дисциплины является приобретение комплекса теоретических знаний и методологических основ в области использования программных обеспечении для решения задач интеллектуального анализа данных, прогнозирования временных рядов, а также непрерывной и дискретной оптимизации
  4. Дискретная математика. Это первый курс дискретной математики, темы которого включают теорию чисел, теорию множеств, функции и последовательности, отношения порядка, рекуррентные отношения, логику и методы доказательства, графики и алгоритмы. Данный предмет готовит студента к дальнейшему изучению математики и информатики
  5. Дифференциальные уравнения. Курс содержит методы решения и исследования решений дифференциальных уравнений, составляющих основу для математических моделей различных теоретических и практических инженерно-экономических задач. Студенты будут решать основные типы дифференциальных уравнений, и исследовать их свойства, освоят аппарат описания сложных нелинейных процессов с упором на приложения в экономике.
  6. Линейная алгебра и аналитическая геометрия. Курс содержит описание матриц, их свойств и характеристик, систем алгебраических уравнений и классических методов их решения, линейных многочленах, векторах, а также основы теории линейного пространства, его базиса и других свойств. Студенты научатся работать с матрицами, преобразовывать их, находить собственные вектора и характеристические числа. Курс также затронет основы теории векторов, плоскостей, поверхностей и их описания в координатных системах. Студенты научатся работать с векторами и проводить операции над ними, работать с различными координатными системами (прямоугольная. полярная, цилиндрическая и др.), проводить преобразования координат, описывать с помощью уравнений линии на плоскости и пространстве.
  7. Математический анализ I. Курс содержит теоретические и практические основы методов анализа и решения задач на вычисление пределов последовательностей и функций, изучение свойства непрерывности функций, на дифференцирование функций одной и нескольких действительных переменных. Студенты освоят возможности применения методов математического анализа для описания и решения конкретных прикладных задач в экономике.
  8. Математический анализ II. Курс содержит теоретические основы теории интегралов (неопределенных и определенных, несобственных, кратных), теории функциональных последовательностей и рядов. Студенты научатся брать интегралы, анализировать их свойства, изучать сходимость рядов и интегралов, решая практические индивидуальные задачи.
  9. Математический анализ III. Курс охватывает теорию дифференциального и интегрального исчисления на функции многих переменных. Темы включают изучение векторов, квадратичных поверхностей, векторных функций, цилиндрических и сферических координат, частных производных, кратных интегралов, векторных полей и линейных интегралов. Все темы включают пркладные задачи и примеры.
  10. Математический анализ VI. Курс применяет исчисление к векторным функциям одной переменной, а также к скалярным и векторным полям. Темы включают градиент, расхождение, завиток; линейные, поверхностные и объемные интегралы; теорема о дивергенции, а также теоремы Грина и Стокса.
  11. Основы программирования. Этот курс знакомит студентов с программированием. Он включает в себя фундаментальные понятия и терминологию алгоритмизации, разработку программ и основы программирования на языке высокого уровня. Темы охватывают, но не ограничиваются формами, свойствами, псевдокодом, типами данных, массивами, операторами, управляющими структурами, методами, классами, объектами и фундаментальными алгоритмами.
  12. Основы R. Дисциплина формирует актуальные знания по программированию и визуализации данных на языке программирования R, а также навыки поиска закономерностей в большом количестве данных и построения статистически корректных выводов. Студенты будут строить и диагностировать статистические модели, сохранять и преобразовывать данные, а также создавать описания и задавать функции, создавать графики и сопоставлять базовые статистические модели с данными.
  13. Прикладная статистика. Дисциплина предполагает продвинутый уровень статистики, который рассматривает вероятностно-статистическую базу прикладной статистики. Описываются методы статистического анализа числовых величин, основные методы многомерного статистического анализа, статистики нечисловых и интервальных данных. Студенты в рамках кейсовой технологии решат практикоориентированные задачи в области социальной и государственной сферы, используя продвинутые статистические методы.
  14. Профессионально-ориентированный иностранный язык. Курс направлен на развитие языковых навыков на уровне А2-В2 и выше эффективной международной коммуникации современного конкурентоспособного специалиста. Целью курса является формирование устойчивых навыков, применяемых в будущей профессиональной деятельности в условиях современного мирового рынка, а также овладение необходимыми языковыми компетенциями для общения на уровне делового языка, и умение правильно строить общение в соответствии с ожиданиями коллег по бизнесу, партнеров и по отношению к членам сообщества. Курс способствует развитию критического мышления, навыков анализа и коммуникации в различных нестандартных деловых ситуациях. Содержание курса включает в себя работу над практическими заданиями по деловой письменной переписке, прагма-профессиональными и типичными ситуациями в бизнес сфере
  15. Статистика. Дисциплина содержит методологию исследования и обработки статистических данных, таких как методы группировок, средних величин, индексов, показателей вариации и другие методы анализа данных, характеризующих экономическое и социальное развитие общества. Студенты проведут сбор и анализ фактических статистических данных, представляя в виде проектов, на основе проведенных индивидуальных либо групповых исследований, формулируя результаты с целью дальнейшего принятия решений.
  16. Теория вероятностей и математическая статистика. Курс охватывает основные принципы теории вероятности и вопросы ее применения. Темы включают элементы комбинаторики, аксиоматику Колмогорова, условные вероятности и независимость событий; дискретные и непрерывные случайные величины; совместные, предельные и условные плотности, характеристические функции; законы больших чисел; биномиальные, пуассоновское, гамма, одномерные и двумерные нормальные распределения
  17. Технологии программирования. Курс научит программированию с использованием объектно-ориентированного подхода и интенсивного практического опыта. Студенты узнают, как применять основные концепции объектно-ориентированного программирования с использованием языка программирования высокого уровня для эффективного программирования приложений среднего уровня сложности. Темы включают инкапсуляцию, наследование, агрегацию, полиморфизм, шаблоны и виртуальные функции. В этом курсе также представлены жизненный цикл и моделирование разработки программного обеспечения, анализ эффективности кода, программирование, управляемое событиями, и обработка исключений.
  18. Учебная практика. Учебная практика направлена на приобретение первичных профессиональных компетенций, включающих закрепление и углубление теоретических знаний, полученных в процессе обучения через работу на предприятиях, в организациях или на базе кафедры. В процессе прохождения учебной практики студенты знакомятся с видами функций и задачами будущей профессиональной деятельности, с организационно-правовой формой, структурой организации и принимают участие в организационных процессах, ведут деловую корреспонденцию и отчетность, а также приобретают навыки работы в трудовом коллективе. В ходе прохождения практики студенты анализируют и формируют информационную базу для написания отчета, который студенты сдают и защищают по результатам прохождения практики
  19. Численные методы. Курс содержит современные методы численных расчетов. Студенты научатся правильно математически формулировать вычислительную задачу, анализировать ее свойства, обоснованно выбирать оптимальный численный метод решения, анализировать свойства алгоритма, реализовывать численный алгоритм решения вычислительной задачи, анализировать полученные решения. На прикладных задачах студенты освоят методы конечных разностей, разностных уравнений, различных разностных схем, понятия устойчивости и скорости сходимости численных методов.

Компоненты по выбору – перечень базовых учебных дисциплин, которые можно выбрать самостоятельно.

  1. Введение в экономику. Курс направлен на формирование экономического мышления у обучающихся, дает общее представление о закономерностях поведения экономических субъектов и механизме функционирования экономики на микро- и макроуровне. Содержание курса включает изучение экономических категорий, экономических законов и механизма хозяйствования, регулирующих отношения в производстве, распределении, обмене и потреблении на различных структурных уровнях экономической системы. Студенты в ходе изучения курса смогут приобрести практические навыки анализа ситуаций на рынках товаров и ресурсов, а также научатся выявлять проблемные ситуации на микро-макроэкономическом уровне.
  2. Визуализация данных. Курс знакомит с концепциями и методами, используемыми в добыче данных. Темы включают разработку прототипов и построение моделей анализа данных; текущие проблемы и области применения анализа данных; правовые и этические вопросы, связанные со сбором и анализом данных. Особое внимание уделяется как алгоритмическим, так и прикладным вопросам, с тем чтобы студенты могли получить знания, необходимые для проведения исследований в области добычи данных и применения методов добычи данных в практическом применении
  3. Профессиональный Excel. Курс рассматривает сбор и обработку данных, манипулирование и проверку данных (Validation), работа с большими и сводными таблицами, применение встроенных функций, использование аналитических инструментов, получение промежуточных итогов, создание шаблонов отчетов, визуальное отображение данных. Используя расширенные функциональные возможности студенты осуществят анализ и визуализацию данных, создание отчетов и проведение сложных расчетов для финансового моделирования, автоматизации учета и т.д.
  4. Регрессионный анализ. Содержание курса: простая линейная регрессия, множественная линейная регрессия, выбор переменных, F-тесты, оценка методом наименьших квадратов, коллинеарность, остаточный анализ, нелинейная регрессия.

Дисциплины по профилю

Вузовские компоненты

  1. Преддипломная практика. Преддипломная практика направлена на подготовку и написание дипломной работы (проекта). В период преддипломной практики обучающийся ознакомится с деятельностью предприятия/учреждения; осуществит сбор необходимой информации по теме исследования соответствующей базы практики, практического материала по теме выпускной работы, изучит основные вопросы/проблемы учреждения в рамках своей темы.
  2. Производственная практика. Производственная практика направлена на закрепление знаний, полученных в процессе обучения, приобретение практических навыков и освоение передового опыта. Цель практики заключается в подтверждении достигнутых результатов обучения при непосредственном осуществлении профессиональной деятельности посредством демонстрации приобретенных навыков и сформированных компетенций. Практика проходит в учреждении/организации, предлагаемом (-ой) вузом либо выбранном (-ой) по инициативе студента и соответствующей профилю образовательной программы. По завершению практики студенты сдают и защищают отчет, демонстрируя достижение запланированных результатов обучения.

Компоненты по выбору

  1. Актуарная математика. Курс посвящен математическим моделям, применяемым в общем страховании. Предмет включает следующие темы: модели для страховых убытков (распределение убытков): гамма, Парето, нормальное распределения. Модели для числа страховых случаев: распределение Пуассона и др. Модели для совокупных страховых возмещений: составное распределение Пуассона, модель индивидуального риска. Теория разорения. Стабильные распределения. Методы моделирования в страховании. Студенты в рамках индивидуальных/групповых проектов будут описывать распределение убытков на реальных данных.
  2. Бизнес-статистика. Дисциплина включает теоретические основы и практические навыки статистического анализа бизнес-процессов, оценки их взаимосвязи, тенденций изменения, планирования и прогнозирования деятельности, в том числе в рамках предприятия. Студенты разработают методологию анализа бизнес-процессов для конкретных типов предприятия с применением пакетов статистического программирования — R, GRETL. Итогом завершения дисциплины будет защита проектов
  3. Введение в глубокое обучение. Цель курса — представить математические, статистические и вычислительные задачи построения стабильных представлений для высокоразмерных данных, таких как изображения, текст и данные. Студенты будут углубляться в отдельные темы глубокого обучения, обсуждая последние модели как из контролируемого, так и из не контролируемого обучения. Особое внимание будет уделено конволюционной архитектуре, обучению инвариантности, неконтролируемому обучению и неконфликтной оптимизации. Темы включают в себя: нейронные модели (например, конволюционные нейронные сети, повторяющиеся нейронные сети), вероятностные графические модели (например, байесовские сети, марковские модели).
  4. Введение в стохастические процессы. Курс направлен на формирование практических навыков применения современных средств обработки информации, теории стохастического моделирования, оценки параметров моделирования, что позволисот прогнозировать и выстраивать финансовую и экономическую стратегию предприятий в условиях сильной волатильности внешних факторов. Студенты научатся применять методы анализа и моделирования случайных процессов и современный математический инструментарий для решения экономических задач.
  5. Искусственный интеллект. Этот курс знакомит с представлениями, методами и архитектурами, используемыми для создания прикладных систем и учета интеллекта с вычислительной точки зрения. Этот курс также исследует применение цепочки правил, эвристического поиска, логики, распространения ограничений, поиска с ограничениями и других парадигм решения проблем. Кроме того, он охватывает приложения деревьев решений, нейронных сетей, SVM и других парадигм обучения.
  6. Математическое моделирование. Курс рассматривает формулирование и анализ математических моделей. Математические инструменты включают анализ размерностей, оптимизацию, моделирование, теорию вероятности и элементарные дифференциальные уравнения. Необходимая математическая и научная база будет развиваться по мере необходимости. Студенты будут участвовать в формулировании моделей, а также в их анализе.
  7. Машинное обучение. В курсе изучается теория машинного обучения, классы задач контролируемого машинного обучения с применением байесовских методов, деревьев решений, логистической регрессии, метода опорных векторов. Студент сможет выявлять скрытые закономерности в больших данных, анализировать полученные результаты и прогнозировать развитие процессов с помощью высокоуровневого языка программирования Python и инновационных компьютерных технологий.
  8. Международная экономическая статистика. Дисциплина рассматривает инструментарий и основные методы международной статистики, методологию их расчета и анализа: статистику трудового потенциала, статистику национального богатства, статистику эффективности экономической деятельности, статистику уровня жизни, статистику внешней торговли, международные сопоставления ВВП.Студенты проведут сравнительный статистический анализ различных экономических процессов и явлений в разных странах мира с использованием реальных данных статистических организаций.
  9. Многомерные статистические методы. В данном курсе рассматриваются статистические методы классификации, методы моделирования данных, кластерный метод, метод главных компонент, методы дисперсионного и корреляционного анализа. Студенты будут исследовать/моделировать сложные реальные бизнес процессы, используя многомерные статистические методы.
  10. Основы демографии и статистика населения. Дисциплина содержит теоретические основы и практикоориентированные методы анализа демографических процессов и ЧР, в том числе такие как -методы анализа показателей воспроизводства и движения населения, концепцию развития человеческого капитала, основных аспектов и индикаторов человеческого развития. Студенты в рамках курса выявят взаимосвязи между человеческим развитием и экономическим ростом, уровнем образования населения, влияния на человеческое развитие эффективного государственного управления и т.д.
  11. Распределенные системы. Курс знакомит с основными принципами, лежащими в основе распределенных систем: процессами, коммуникацией, именованием, синхронизацией, последовательностью, отказоустойчивостью и безопасностью. Студенты будут знакомиться с некоторыми из основных парадигм распределенных систем: системы на основе объектов, файловые системы, веб-системы и системы на основе координации. По окончании курса студенты поймут основы распределенных вычислений и смогут проектировать и разрабатывать распределенные системы и приложения.
  12. Система национальных счетов. Дисциплина содержит методологию проведения анализа экономических процессов на макроуровне на основе международного стандарта по статистике. Рассматривает принципы и закономерности экономического кругооборота и соответствующий каждой стадии специальный счет либо группа счетов. Используя национальные счета на занятиях студенты проанализируют информацию в каждом секторе или по отраслям экономики посредством индивидуальных заданий на реальных кейсах (www.statgov.kz и др.)
  13. Система управления базами данных. Курс фокусируется на концепциях, необходимых для разработки и внедрения системы управления базами данных. В рамках курса изучаются различные современные модели данных, безопасность и целостность данных, а также методы параллельных вычислений
  14. Статистика производства и инвестиций. Дисциплина рассматривает методологию исчисления показателей статистики инвестиций, их расчет и анализ; статистику инвестиции в производство и их эффективность, статистику продукции, статистику себестоимости продукции, статистику финансовых результатов предприятий. Во время занятий посредством индивидуальной /групповой работы студенты научатся решать практикоориентированные задачи анализа показателей эффективности инвестиции и производства для дальнейшего принятия решений.
  15. Статистика рынка товаров и услуг. Дисциплина содержит методологию оценки и измерения статистических показателей, характеризующих состояние и развитие рынка, его состав, основные тенденции и закономерности, зависимости рынка от различных факторов, а также влияние рынка на экономику и социальную жизнь. Студенты будут анализировать рынок товаров и услуг с целью обоснования для принятия решений компанией
  16. Статистический анализ рисков. Дисциплина содержит методологию статистического анализа рисков на основе решений в риск-менеджменте. Студент сможет оценить уровни рисков, выявить риски в разных ситуациях, и оценить воздействие принятых решений на снижение рисков. На практических занятиях студенты оценят вероятность появления неблагоприятных событий, выявят связь между внешними и внутренними факторами среды, проведут прогнозирование будущих рисков на основе качественных и количественных методов.
  17. Технологическое предпринимательство. Курс рассматривает уникальные задачи, стоящие перед предпринимателем в области управления стоимостью, а также важность инноваций на основе технологий для создания и развития нового предприятия в мировой индустрии продуктов и услуг. Курс включает в себя четыре основные темы: (1)предпринимательская инновация (2) взаимосвязь между инновациями, созданием стоимости и улавливанием стоимости среди клиентов, заинтересованных сторон и рынка, (3) роль технологии в создании глобального конкурентного преимущества как в отраслях, основанных на продуктах и услугах, и (4) разработка и мониторинг оперативной структуры для предоставления новой стоимости в продуктах и услугах.
  18. Управление данными (Big Data). Дисциплина рассматривает современные методы хранения и управления данными, как в классических реляционных системах управления базами данных (СУБД), так и в системах, предназначенных для обработки больших данных. Студент научится организовывать данные, применять системы нового поколения: хранилища ключ-значение, документно-ориентированные и графовые СУБД, системы распределенного хранения и обработки данных на основе технологии MapReduce, аналитические системы на основе многомерных моделей данных.
  19. Финансово-банковская статистика. Дисциплина рассматривает методологию оценки и измерения статистических показателей финансово-банковской сферы — уровня дефицита государственного бюджета, уровня инфляции, номинальных и реальных процентных ставок, курса валют, в том числе в связи с переходом на международные стандарты. Студенты применят статистические методы финансово-банковской статистики для выработки решений по выдаче кредитов, определения кредитоспособности, эффективности вкладывания финансовых средств, и т.д.
  20. Data Lake и системная инфраструктура. Курс включает широкое представление о разведке и управлении большими массивами данных, генерируемыми и используемыми в современном мире. Во-первых, вводятся практические методы, используемые при анализе разведочных данных и добыче; темы включают подготовку данных, визуализацию, статистику для понимания данных, а также методы группирования и прогнозирования. Во-вторых, представлены подходы, используемые для хранения, получения и управления данными в реальном мире; темы включают традиционные системы баз данных, языки запросов, а также целостность и качество данных.