Продолжай учиться!

Программирование и машинное обучение

Для того, чтобы осваивать информационные технологии, не нужно ничего, кроме желания (и английского, разумеется).

Лучшие программы профессионального уровня разработаны сообществами энтузиастов и существуют более 20 лет — учитесь и пользуйтесь ими бесплатно, без рекламы, платных «продвинутых» версий и прочей ерунды.

  • Python — интерпретируемый язык программирования, интегрированный с С
  • R — профессиональный язык статистического программирования

w3schools.com — ведущий ресурс для обучения ряду языков программирования, больше ориентированный на веб-мастеров.


Машинное обучение

В скором времени без знаний основ машинного обучения делать будет нечего в большинстве аналитических профессий. Начните прокачиваться уже сейчас!

Вводные лекции:

Дополнительные материалы на сайтах курсов Стэнфордского университета: сверточные сети и машинное обучение.

Почитать: книга Pattern Recognition and Machine Learning.


Питон

В крупных и не очень компаниях мира стала популярной так называемая «наука о данных» («data science»), суть которой сводится к применению численных методов для анализа больших массивов данных с целью извлечения дополнительной прибыли. Это направление, несомненно, является очень важным и перспективным, однако вокруг него сложился целый шоу-бизнес популяризаторов компьютерных наук.

С тех пор как компания Google открыла доступ к своему модулю численных методов TensorFlow, мировая слава захлестнула и Питон, для которого он был написан. Мальчики и девочки в деловых костюмах взахлеб рассказывают про датусайенс и наших братьев датасайентистов (не путать с адвентистами), хотя для большинства из них, как и для их слушателей, численные методы вместе с Питоном так и останутся предметами с неясными очертаниями из далекого космоса.

Вся эта шумиха серьезно мешает тем, кто действительно хочет и может научиться работать на Питоне.

Питон — один из языков программирования, похожий на все остальные. В нем есть свои особенности синтаксиса и организации данных. В популярной литературе подчеркивается, что программы на Питоне легко читаются благодаря уникальному подходу к организации кода с помощью отступов, и что он — очень простой и естественный, почти как обычный человеческий (английский) язык. Не тратьте время на чтение и обдумывание пустой болтовни. Все это не имеет значения.

Важно то, что Питон:

Освоение Питона

Центральный портал со ссылками на ресурсы — Python.org. Однако, на наш взгляд, там слишком много лирики.

Мы рекомендуем начинать с вводного курса по Питону на сайте w3schools.com. Пока еще нельзя сказать, что материалы именно по Питону здесь очень полны. Но нам нравится конкретный стиль изложения, по делу и без ненужных отступлений. На этом сайте вы научитесь двум основным вещам: установке, запуску и началу работы с Питоном (включая подгрузку библиотек) и правилам синтаксиса языка. Если вам уже знакомы основные понятия программирования, то на ознакомление уйдет до двух часов, если же опыта программирования у вас нет, то придется разбираться несколько дольше.

Следующий шаг — использовать язык для решения прикладных задач. Для широкой публики обычно их две. Первая — автоматизация работы с интернетом, например, автоматическая загрузка веб-страниц и анализ текста на них. Начните с освоения модуля Selenium или поищите в поисковике альтернативные решения.

Вторая — применение численных методов для различных научных и бизнес-задач. Для них существуют три широко распространенных инструмента: Матлаб, R и Питон. Какой выбрать?

По нашему мнению лучший из них — Матлаб, благодаря лаконичному языку работы с матрицами. Однако, у Матлаба есть один крупный недостаток: лицензия на него продается за деньги и дорого стоит.

R и Питон бесплатны. С точки зрения удобства написания кода для математических задач они примерно одинаковы и оба уступают Матлабу. С точки зрения эффективности хороши все три. Вы вполне можете освоить и R, и Питон — да, знаки препинания там расставляются по-разному, но идеи те же. При этом вы получите доступ к более широкому набору готовых разработок.

Если вы хотите сконцентрироваться на чем-то одном, то мы рекомендуем Питон. В отличие от R, который изначально предназначен для решения аналитических задач, Питон — универсальный язык программирования. Инвестируя свое время в освоение Питона, вы открываете себе возможности в других областях, таких как работа с подключенными к сети устройствами («интернетом вещей»).

Какие библиотеки нужны для работы с численными методами в Питоне? Самых важных — четыре, все они хорошо описаны на Python Course.eu:

Если вы столкнулись с какой-то особенной численной задачей, то помните, что ее уже наверняка кто-то решил — ищите готовый код по ключевым словам в поисковике (в крайнем случае, напишите его сами).

Другие ресурсы

Популярная платформа для работы с Питоном и R:

Python для начинающих: курс обучения на Coursera.

ИТ-курсы на Data Camp.