Управление вычислениями

Антон Брагин, Сергей Мозгов

Институт биоинформатики (Bioinformatics Institute)

Курс посвящен изучению инструментария для работы с данными, автоматизации анализа и обеспечению воспроизводимости.

Syllabus

1.Введение
2.Контейнеризация и Docker
2.1 Знакомство с Docker
2.2 Работа с файлами в контейнерах Docker
2.3 Взаимодействие контейнеров Docker
2.4 Работа с образами Docker
2.5 Технологические основы и роль контейнеризации
3. Workflows и Pipelines
3.1 Работа с данными и пайплайны
3.2 Инструменты пайплайнинга и подходы к описанию пайплайнов
3.3 Snakemake: имплицитное описание графа анализа
3.4 Snakemake: создание пайплайнов
4. Common Workflow Language
4.1 Знакомство с CWL
4.2 Описание инструментов с использованием CWL
4.3 CWL: полезные компоненты
4.4 CWL: создание пайплайнов
5. Заключение

key words, tags

управление вычислениями, Docker, Linux, пайплайн, Python


Course properties

Competition track
Science and engineering
Form of education
Nonformal
Formal education level
Further education, Professional development
Recommended age for informal learning
19-25, 25-45
Learning language
Russian
Discipline
Software and applications development and analysis
Course authors
Антон Брагин, Сергей Мозгов
Author’s characterization
Антон Брагин, Руководитель группы биоинформатики в компании Parseq Lab. Сергей Мозгов, Инженер ИТ-инфраструктуры, Parseq Lab С отличием закончил ОрелГТУ по направлению “Информационные системы”. Степень кандидата технических наук по специальности 051306 “Автоматизация технологических процессов и производств”. Занимался промышленной автоматизацией и задачами управления вычислительными системами. Занимается проектами по анализу данных в области Life Science с использованием High Performance и Cloud Computing.
Tutors
Антон Брагин, Сергей Мозгов
Organization
Институт биоинформатики (Bioinformatics Institute)
Organization characterization
Институт биоинформатики открыт в 2013 году в Санкт-Петербурге на основе курсов по биоинформатике, которые открылись в 2010 году на базе Академического университета (СПбАУ РАН) при поддержке компании JetBrains и лаборатории алгоритмической биологии СПбАУ РАН. Институт предоставляет дополнительное образование: студенты совмещают обучение с основными образовательными программами в других вузах, профессиональной или научной деятельностью. Институт сотрудничает с СПбАУ РАН и ведущими компаниями и лабораториями в области биоинформатики и биотехнологий. В рамках обучения студенты занимаются научной работой по решению реальных задач биоинформатики.
Knowledge level entrance requirements
От учащихся потребуются навыки работы с операционной системой Linux, в том числе уверенное использование терминала и знание базовых команд bash. Также будут востребованы навыки программирования на языке Python 3.
Career list corresponds to course
Биоинформатика, специальности, связанные с анализом данных.
Entrance test
Groups formation by readiness level
Teachers presence
Tutors presence
Facilitators presence
Training materials forms
texts, video lecture, synchronous video, professional software access
Interactivity in training materials
Collaborative learning presence
Discussions, forums presence
Webinars, video conferences presence
meetup presence
LMS integration
Learning Analytics
Certification presence
Certification types
Сертификат от Stepik
Certificate levels
обычный сертификат, сертификат с отличием
Course time limits
Duration
3 (weeks)
Learning types (sync/async)
asynchronous
Assessment types
test, creative work
Module unit
неделя
Course modules number
5
Personal learning path possibility, course individualization
Operating System
Ubuntu (Linux), Python 3, Docker, cwltool
Supported browsers
Chrome, Opera, Mozilla, Edge, Internet Explorer
Learner’s devices
Персональный компьютер
Special needs support

Comments