Хочу всё знать: язык R
Давайте немного поговорим о языке программирования под названием R. В последнее время вы могли у нас в блогах прочитать статьи о Big Data и Data Science, тех сферах, где просто необходимо под рукой иметь мощный язык для работы со статистикой и графиками. И R как раз из таких. Новичку в мире программирования буде достаточно непросто в это поверить, но сегодня R уже популярнее SQL, он активно используется в коммерческих организациях, исследовательских и университетах.
Не вникая в правила, синтаксис и конкретные области применения, просто давайте рассмотрим основные книги и ресурсы, которые помогут вам с нуля изучить R.
GeekBrains рекомендует
Что такое язык R, зачем он вам нужен и как его можно использовать с умом, можно узнать из прекрасного вебинара Руслана Купцова, который он провёл чуть меньше года назад в рамках GeekWeek-2015.
Книги
Теперь, когда в голове есть определённый порядок, можно приступать к чтению литературы, благо её более чем достаточно. Начнём с отечественных авторов:
«Статистический анализ и визуализация данных с помощью R», Мастицкий С.Э., Шитиков В.К.
«Наглядная статистика. Используем R!», А.Б. Шипунов, Е.М. Балдин и др.
Несмотря на то, что в эти книги имеют безусловную ценность для человека, изучающего язык R, они немного перегружены статистическими подходами. То есть если вы только учитесь в университете или недавно его окончили, то это проблем не вызовет. Однако если вам 13 или 35, то к статистическому анализу лучше подойти как раз сперва изучив язык.
Поэтому рассмотрим книги на английском языке, которые в этом помогут чуть лучше:
«Learning R», Richard Cotton
«Introduction to Data Science with R», Garrett Grolemund
«Introductory Statistics with R», Peter Dalgaard
Эти книги, пусть они и на иностранном языке, описывают язык R более доступно именно для новичка.
Естественно, для языка, который существует уже более 20 лет, было написано и переведено на русский немало книг. Вот парочка:
«Анализ сетей (графов) в среде R», Дуглас Люк
«Введение в статистическое обучение с примерами на языке R», Джеймс Г., Уиттон Д., Хасти Т., Тибширани Р.
Как видно из названий этой литературы, здесь вновь язык R рассматривается в прямой связи со статистикой, но так как азам вы уже обучились, то эффект будет исключительно положительный.
Ну и подводя некий этой этому разделу, в последней ссылке вы найдёте список всей рекомендованной разработчиками R англоязычной литературы:
Интернет-ресурсы
Любой человек, желающий изучить какой-либо язык программирования обязательно должен посетить в поисках знаний два ресурса: официальный сайт его разработчиков и самое крупное онлайн сообщество. Что ж. не будем делать исключение и для R:
Но опять проникшись заботой к тем, кто английский язык выучить ещё не успел, а вот изучить R ну очень хочет, упомянем несколько российских ресурсов:
Книги и статьи Евгения Балдина про R, статистику и не только;
Вот в общем и всё, если не считать разрозненных материалов блогеров. Впрочем, если вам известны российские сайты, где можно почитать много информации про R, обязательно оставляйте ссылки в комментариях.
А пока довершим картину небольшим списком англоязычных, но от этого не менее познавательных сайтов:
CRAN – собственно, место где можно загрузить к себе на компьютер среду разработки R. Кроме того мануалы, примеры и прочее полезное чтиво;
Quick-R – коротко и понятно про статистику, методы её обработки и язык R;
Burns-Stat – про R и про предшественника его S с огромным количеством примеров;
R for Data Science – ещё одна книга от Гаррета Гроулмунда (Garrett Grolemund), переведённая в формат онлайн учебника;
Awesome R – подборка лучшего кода с официального сайта, размещённая на нашем любимом GitHub;
Mran – язык R от Microsoft;
Tutorial R – ещё один ресурс с упорядоченной информацией с официального сайта.
Освоить востребованную профессию в Data Science можно всего за полтора года на курсах GeekBrains. После учёбы вы сможете работать по специальностям Data Scientist, Data Analyst, Machine Learning, Engineer Computer Vision-специалист или NLP-специалист.
Освоить востребованную профессию в Аналитике больших данных можно всего за полтора года на курсах GeekBrains.