Prg67.ru

Онлайн вебинары
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Курсы язык программирования r

R для лингвистов: программирование и анализ данных

  • 10 недель

от 5 до 6 часов в неделю

понадобится для освоения

3 зачётных единицы

для зачета в своем вузе

Данный курс знакомит слушателей с основами программирования на языке R, а также позволяет разобраться во всех этапах анализа данных. В ходе курса на примере задач теоретической и компьютерной лингвистики будут рассмотрены математические основы методов статистического анализа. Курс рассчитан на студентов-лингвистов, однако не предполагает никаких предварительных знаний по лингвистике, программированию и математике.

О курсе

Данный курс знакомит с основами программирования и обработки данных в R. Курс в первую очередь предназначен для теоретических лингвистов, хотя и не предполагает никаких предварительных знаний в какой-то конкретной области. В противовес стандартным курсам R, обычно основанным на статистической обработке данных и их визуализации, значительная часть курса посвящена работе со строками и обработке естественного языка. Курс состоит из 10 недель, которые охватывают все разделы анализа данных: загрузка, чистка, разведочный анализ, визуализация и статистическое моделирование. Большинство недель будет заканчиваться 4 часовым тестом, в ходе которого нужно будет решить несколько задач на программирование или анализ данных. В части курса, посвященной статистическому анализу данных, мы обсудим основы статистического вывода и обсудим базовые статистические тесты. Кроме того мы обсудим методы построения регрессий и кластеризации, что станет хорошей базой для дальнейших курсов посвященных продвинутому статистическому анализу и машинному обучению. Для работы на курсе необходимо будет установить программы R и RStudio. Пакеты необходимые для установки, будут перечислены в ходе лекций.

Формат

Курс состоит из коротких видеолекций от 8 до 15 минут длиной, внутри которых встроены неоцениваемые вопросы. На каждой неделе будет представлен оцениваемый тест содержащий задачи на программирование, анализ и визуализацию данных.

Информационные ресурсы

— Levshina, N. (2015). How to do linguistics with R: Data exploration and statistical analysis. John Benjamins Publishing Company.

— Gries S. Th. (2009) Quantitative Corpus Linguistics with R: A Practical Introduction

— Baayen R. H. (2006) Analyzing Linguistic Data

— Wickham H. (2015) Advanced R

— Everitt B. S., Hothorn T. (2006) A handbook of statistical analyses using R

Требования

В основном обучение ведется с нуля, однако базовые элементы программирования: такие как функция, переменные, циклы, подробно объясняться не будут. Так что знание других языков программирования, например, Python облегчит понимание, но не является обязательным. Примеры все будут приводится на данных для лингвистов, но никакого предварительного лингвистического образования не требуется.

Программа курса

1. Введение в R: основные элементы, функции, циклы
2. Продвинутая обработка данных: пакеты tidyr и dplyr
3. Работа со строками: строки в R, регулярные выражения
4. Визуализация данных: base R vs. ggplot2
5. Интерактивная визуализация: rmarkdown, plotly, lingtypology
6. Работа с текстами: пакет tidytext
7. Введение в статистику: основы фриквентисткой статистики, формулировка гипотез
8. Корреляция и линейная регрессия
9. Кластеризация
10. Логистическая регрессия

Результаты обучения

  • Готовность использовать основные законы научных дисциплин в профессиональной деятельности, применять методы математического анализа и моделирования, теоретического и экспериментального исследования в лингвистике

Формируемые компетенции

  • ОНК-1 Готовность использовать основные законы научных дисциплин в профессиональной деятельности, применять методы математического анализа и моделирования, теоретического и экспериментального исследования в лингвистике
  • ИК-1 Способность самостоятельно работать на компьютере с использованием современного общего и профессионального прикладного ПО
  • ПК-4 Умение осуществлять сбор, анализ и обработку данных, необходимых для решения поставленных экономических задач
  • ПК-10 Способность использовать для решения аналитических и исследовательских задач

Направления подготовки

Знания

  • Язык программирования R
  • Основы статистики

Умения

Умение осуществлять сбор, анализ и обработку данных, необходимых для решения поставленных экономических задач

Навыки

  • Способность самостоятельно работать на компьютере с использованием современного общего и профессионального прикладного ПО
  • Способность использовать для решения аналитических и исследовательских задач современные технические средства и информационные технологии

Поделиться

  • 10 недель

от 5 до 6 часов в неделю

Читать еще:  Курсы по работе с клиентами

понадобится для освоения

3 зачётных единицы

для зачета в своем вузе

Мороз Георгий Алексеевич

Должность: Старший преподаватель школы лингвистики/Факультет гуманитарных наук

Хочу всё знать: язык R

Давайте немного поговорим о языке программирования под названием R. В последнее время вы могли у нас в блогах прочитать статьи о Big Data и Data Science, тех сферах, где просто необходимо под рукой иметь мощный язык для работы со статистикой и графиками. И R как раз из таких. Новичку в мире программирования буде достаточно непросто в это поверить, но сегодня R уже популярнее SQL, он активно используется в коммерческих организациях, исследовательских и университетах.

Не вникая в правила, синтаксис и конкретные области применения, просто давайте рассмотрим основные книги и ресурсы, которые помогут вам с нуля изучить R.

GeekBrains рекомендует

Что такое язык R, зачем он вам нужен и как его можно использовать с умом, можно узнать из прекрасного вебинара Руслана Купцова, который он провёл чуть меньше года назад в рамках GeekWeek-2015.

Книги

Теперь, когда в голове есть определённый порядок, можно приступать к чтению литературы, благо её более чем достаточно. Начнём с отечественных авторов:

Несмотря на то, что в эти книги имеют безусловную ценность для человека, изучающего язык R, они немного перегружены статистическими подходами. То есть если вы только учитесь в университете или недавно его окончили, то это проблем не вызовет. Однако если вам 13 или 35, то к статистическому анализу лучше подойти как раз сперва изучив язык.

Поэтому рассмотрим книги на английском языке, которые в этом помогут чуть лучше:

Эти книги, пусть они и на иностранном языке, описывают язык R более доступно именно для новичка.

Естественно, для языка, который существует уже более 20 лет, было написано и переведено на русский немало книг. Вот парочка:

Как видно из названий этой литературы, здесь вновь язык R рассматривается в прямой связи со статистикой, но так как азам вы уже обучились, то эффект будет исключительно положительный.

Ну и подводя некий этой этому разделу, в последней ссылке вы найдёте список всей рекомендованной разработчиками R англоязычной литературы:

Интернет-ресурсы

Любой человек, желающий изучить какой-либо язык программирования обязательно должен посетить в поисках знаний два ресурса: официальный сайт его разработчиков и самое крупное онлайн сообщество. Что ж. не будем делать исключение и для R:

Но опять проникшись заботой к тем, кто английский язык выучить ещё не успел, а вот изучить R ну очень хочет, упомянем несколько российских ресурсов:

Вот в общем и всё, если не считать разрозненных материалов блогеров. Впрочем, если вам известны российские сайты, где можно почитать много информации про R, обязательно оставляйте ссылки в комментариях.

А пока довершим картину небольшим списком англоязычных, но от этого не менее познавательных сайтов:

CRAN – собственно, место где можно загрузить к себе на компьютер среду разработки R. Кроме того мануалы, примеры и прочее полезное чтиво;

Quick-R – коротко и понятно про статистику, методы её обработки и язык R;

Burns-Stat – про R и про предшественника его S с огромным количеством примеров;

R for Data Science – ещё одна книга от Гаррета Гроулмунда (Garrett Grolemund), переведённая в формат онлайн учебника;

Awesome R – подборка лучшего кода с официального сайта, размещённая на нашем любимом GitHub;

Mran – язык R от Microsoft;

Tutorial R – ещё один ресурс с упорядоченной информацией с официального сайта.

Давайте немного поговорим о языке программирования под названием R. В последнее время вы могли у нас в блогах прочитать статьи о Big Data и Data Science, тех сферах, где просто необходимо под рукой иметь мощный язык для работы со статистикой и графиками. И R как раз из таких. Новичку в мире программирования буде достаточно непросто в это поверить, но сегодня R уже популярнее SQL, он активно используется в коммерческих организациях, исследовательских и университетах.

Читать еще:  Курсы сестринское дело без медицинского образования

Не вникая в правила, синтаксис и конкретные области применения, просто давайте рассмотрим основные книги и ресурсы, которые помогут вам с нуля изучить R.

GeekBrains рекомендует

Что такое язык R, зачем он вам нужен и как его можно использовать с умом, можно узнать из прекрасного вебинара Руслана Купцова, который он провёл чуть меньше года назад в рамках GeekWeek-2015.

Книги

Теперь, когда в голове есть определённый порядок, можно приступать к чтению литературы, благо её более чем достаточно. Начнём с отечественных авторов:

Несмотря на то, что в эти книги имеют безусловную ценность для человека, изучающего язык R, они немного перегружены статистическими подходами. То есть если вы только учитесь в университете или недавно его окончили, то это проблем не вызовет. Однако если вам 13 или 35, то к статистическому анализу лучше подойти как раз сперва изучив язык.

Поэтому рассмотрим книги на английском языке, которые в этом помогут чуть лучше:

Эти книги, пусть они и на иностранном языке, описывают язык R более доступно именно для новичка.

Естественно, для языка, который существует уже более 20 лет, было написано и переведено на русский немало книг. Вот парочка:

Как видно из названий этой литературы, здесь вновь язык R рассматривается в прямой связи со статистикой, но так как азам вы уже обучились, то эффект будет исключительно положительный.

Ну и подводя некий этой этому разделу, в последней ссылке вы найдёте список всей рекомендованной разработчиками R англоязычной литературы:

Интернет-ресурсы

Любой человек, желающий изучить какой-либо язык программирования обязательно должен посетить в поисках знаний два ресурса: официальный сайт его разработчиков и самое крупное онлайн сообщество. Что ж. не будем делать исключение и для R:

Но опять проникшись заботой к тем, кто английский язык выучить ещё не успел, а вот изучить R ну очень хочет, упомянем несколько российских ресурсов:

Вот в общем и всё, если не считать разрозненных материалов блогеров. Впрочем, если вам известны российские сайты, где можно почитать много информации про R, обязательно оставляйте ссылки в комментариях.

А пока довершим картину небольшим списком англоязычных, но от этого не менее познавательных сайтов:

CRAN – собственно, место где можно загрузить к себе на компьютер среду разработки R. Кроме того мануалы, примеры и прочее полезное чтиво;

Quick-R – коротко и понятно про статистику, методы её обработки и язык R;

Burns-Stat – про R и про предшественника его S с огромным количеством примеров;

R for Data Science – ещё одна книга от Гаррета Гроулмунда (Garrett Grolemund), переведённая в формат онлайн учебника;

Awesome R – подборка лучшего кода с официального сайта, размещённая на нашем любимом GitHub;

Mran – язык R от Microsoft;

Tutorial R – ещё один ресурс с упорядоченной информацией с официального сайта.

Прикладная аналитика на R

Чтобы использовать статистические критерии и модели не требуется сложных навыков программирования. Поэтому мы разработали профессиональную онлайн-программу «Прикладная аналитика на R», которая позволит повысить ваш уровень в сфере аналитики и получить дополнительные компетенции, востребованные в крупных IT-компаниях.

Язык R содержит огромное число инструментов для загрузки, преобразования и анализа данных, средств визуализации, создания статистических отчетов и приложений. R позволяет производить все действия в одной среде, минуя прямое взаимодействие с базами данных, сайтами и другими инструментами.

Цель курса: обучить профессиональным навыкам работы с богатыми возможностями языка R для анализа и визуализации данных.

Программа разработана специально для:

— маркетологов, которые хотят перейти от Excel/ SPSS/ Statistica к более продвинутым средствам анализа;
— финансовых аналитиков, риск-менеджеров, кредитных аналитиков, которым необходимо искать закономерности в данных, визуализировать и строить статистически обоснованные выводы;
— начинающих изучать машинное обучение, которые хотят войти в аналитику, в том числе изучить машинное обучение
— тех, кто используют сервисы веб-аналитики и делают отчеты о своей работе в системах BI посредством API, чтобы средствами языка создавать информативные отчеты
— SEO, чтобы эффективнее делать отчеты
— контекстологам, которые работают с рекламными сетями и разными сервисами ,тем самым делая много рутинных операций
— начинающих изучение R в анализе данных;

Читать еще:  Курсы frontend киев

в ходе занятий изучаются методы,

востребованные на рынке

сначала объясняем «как делать», потом все остальные важные аспекты

каждое ДЗ — реальный мини-кейс из опыта преподавателей или ваша задача с работы

материалы будут вам полезны, как reference point, в будущих задачах (+cheat-sheets по темам)

✓ решать ваши рабочие задачи эффективным и воспроизводимым способом;
✓ писать код для повторного использования, автоматизирующий рутинные задачи (e.g. создание отчетов);
✓ пользоваться основными пакетами R для работы с данными, создания графиков и выполнения статистического анализа.

Занимается разработкой под алго- и высокочастотный трейдинг (HFT) на языке R более 5 лет.
За это время с другими командами из разных стран мира реализовал более 32 проектов, как в области high-frequency trading, так и риск-менеджмента, финансового инжиниринга (ABS, MBS, structured products, interest rates modeling (LIBOR, SABR, ARIMA, GARCH)), разработки торговых десков для проп.трейдинговых компаний из Нью-Йорка, Чикаго, Арканзаса, Флориды, Австралии, ОАЭ и т.д
Сотрудничает с несколькими хедж-фондами из Нью-Йорка и Лос-Анджелеса, а также финансовыми институтами из Лондона и Центральной Европы занимающимися quant development и AI в области инвестиций и торговли на фондовых биржах.
В настоящий момент совместно с коллегой ведет несколько пилотов по разработке библиотеки и аналитического модуля для крупного поставщика софта для торговли на финансовых рынках.
Также в разработке находится система Collateral mgm для крупного заказчика из США.

Стек используемый в разработке достаточно богат и широк: R, Python, Java, C++, C#, Matlab, AWS, Microsoft Azure, Oracle DB, Cassandra, Kubernetes, Apache Spark, Kafka.
Модули и библиотеки: Pandas, Pytorch, SciPy, NumPy, scikit-learn, Caffe, Bokeh, Theano, Lasagne, Quantlib, Quanmod, Tensorflow, Keras, quanttrade, Quantconnect, Quantiacs, wbdata, IQFeed, Bloomberg API, etc/

PhD (аспирант 4 года) в North Carolina State University, USA.
Область профессиональных интересов: анализ полевых и лабораторных данных качества водной среды для последующего построения прогнозных моделей. R является основным инструментом, в работе применяются регрессионный анализ и байесовый подход.

Образование: магистр наук по специальности гидролог (TU Dresden, 2015), инженер-эколог (МИСиС, 2009).

Опыт преподавания: 3 года в роли ассистента профессора в North Carolina State University.

Участник международных конференций: 25th Biennial CERF Conference (2019), 15th Estuarine and Coastal Modeling Conference (2018) , North Carolina’s Coastal Conference (2017).

Занимается программированием на R более 4 лет.
Имеет опыт работы с широким спектром инструментов анализа и программирования — регрессия, анализ временных рядов и построение прогнозных моделей (forecast), байесовские методы, сетевой анализ, визуализация данных (ggplot2, plotly, ggmap), парсинг сайтов (xml2), Rmarkdown отчеты, интеграция C++ в R (Rcpp), чистка и обработка данных.

Любит узнавать новое и делиться знаниями.

Ведет проекты анализа данных в сфере психологии групп.

В основом работал в сфере анализа текстовых данных.

Как инструменты использовались библиотеки tm, NLP, UDPipe, igraph, statnet, rvest, XML, DBI, RPostgreSQL базы данных Postgres, memcached и набор ставших стандартом функций и пакетов предобработки данных.

Одна из проблем психометрии — искажение полученных данных ментальным представлением человека о себе. Этих искажений лишен анализ неструктурированных данных, который может давать доступ в процессы психики, неискаженные искусственными, наигранными проявлениями.
В сфере взаимоотношений людей часто встречается фраза: «Счастье — это когда тебя понимают».
Счастье исследователя — получать доступ в ранее закрытые, неведомые процессы.

Аналитик со стажем работы в крупных телекоммуникационных компаниях, таких как МТС, Ростелеком.

Уверена, что посчитать и измерить можно все на свете — главное найти правильную шкалу и метрику.

Обожает задавать себе и другим сложные провокационные вопросы и найти на них ответ в данных.

Ссылка на основную публикацию
Adblock
detector